又是一年年底,年终述职总结刚刚完成了,这一年有不足也有进步,新的一年继续加油。先从整理资料开始吧! 之前的工作…
这篇文章关于ucb 探索的简介和代码实现,大部分来自网上的一个大佬的文章,然后我试着改了写代码备注,新增了一个…
如果模型的label为连续的概率值,选择什么loss 函数进行学习。抛出这个问题,因为现在在做一个视频推荐的项…
NCE评测指标是facebook以前提出的一个评测ctr模型的指标,中文翻译一下就是归一化交叉信息熵,在提到归…
前言 美团技术博客最近出了一篇文章讲多任务学习,优化的对象是深层转化。 上图是论文中给出的一个深层转化的过程图…
背景 延迟转化应该是很多 cvr 预估场景都会遇到的问题,这个也是用户的行为有很大的关心,本身用户的深层行为是…
首先,DSSM:在这里特指双塔模型;FM自不必说。 训练部署 大家都懂再来啰嗦下双塔和FM在做召回时,线上的部…
作者:铁心核桃 链接:https://www.zhihu.com/question/448924025/ans…
问题:Youtube为什么要用这个巨大的softmax多分类来建模,而不是用p(w|user,video)的二…
在看一个大佬向量的解释时候提到召回中的向量的解耦,看完之后有所感触,回想 DSSM 中的实现,跟这描述似乎完全…
新业务线上现在有很多种召回策略,在线和离线都有,使用深度召回期望能召回与用户更相关并且感兴趣的物品。这几天页研…
引言 关于faiss的使用也是在使用embedding相似度召回的时候接触到,的确是一个高效的计算相似度的方案…
引子 大名鼎鼎的NLP论文《all in attention》诠释了attention的厉害。attentio…
ID类特征在很多应用场景下都会遇到,电商里面的物品id,信息流里面资讯id,用户的id等等。id 类特征可以直…
百度的Familia提供了工业界主题向量的应用,现在应该很多的工业界项目中会应用到,也取得不错的效果。官方的文…
在前面两篇文章中,我们用一个框架梳理了各大优化算法,并且指出了以Adam为代表的自适应学习率优化算法可能存在的…
在上篇文章中,我们用一个框架来回顾了主流的深度学习优化算法。可以看到,一代又一代的研究者们为了我们能炼(xun…
机器学习界有一群炼丹师,他们每天的日常是: 拿来药材(数据),架起八卦炉(模型),点着六味真火(优化算法),就…