为什么突然会聊到这个话题呢,最近负责的这个项目有这个环节,也是有机会去学习这块的知识,顺便在实际的项目中实践一…
特征维度 1.架构设计和工程问题导致的特征分布不一致 在线特征大都是服务实时抽取,上下文等由redis等实时读…
前言 Embedding table 优化关键的一点是内存空间占用的优化,比如一个id类特征几个亿,维度32维…
前言 在之前的一篇文章中介绍了 Hinton 的胶囊网络,MIND 中也是使用了胶囊网络不过做了一些修改。 M…
导言 为什么会有这篇文章?因为在看 MIND 的时候它就使用了胶囊网络,当时看着有点懵,所以看着论文的引用,原…
前言 ok,继续开展召回的学习。这一篇是阿里的2018 kdd的文章,属于Graph Embedding领域。…
PAL算法是华为提出的一个解决Position bias 的方法,先说结论:单独构建一个 Position 网…
又是一年年底,年终述职总结刚刚完成了,这一年有不足也有进步,新的一年继续加油。先从整理资料开始吧! 之前的工作…
这篇文章关于ucb 探索的简介和代码实现,大部分来自网上的一个大佬的文章,然后我试着改了写代码备注,新增了一个…
如果模型的label为连续的概率值,选择什么loss 函数进行学习。抛出这个问题,因为现在在做一个视频推荐的项…
NCE评测指标是facebook以前提出的一个评测ctr模型的指标,中文翻译一下就是归一化交叉信息熵,在提到归…
前言 美团技术博客最近出了一篇文章讲多任务学习,优化的对象是深层转化。 上图是论文中给出的一个深层转化的过程图…
dssm双塔召回算是召回模型的经典之作,就是到现在也是广泛在应用,研究dssm网络的改进也是大有人在,今天写的…
背景 延迟转化应该是很多 cvr 预估场景都会遇到的问题,这个也是用户的行为有很大的关心,本身用户的深层行为是…
首先,DSSM:在这里特指双塔模型;FM自不必说。 训练部署 大家都懂再来啰嗦下双塔和FM在做召回时,线上的部…
下面这个一段文字也是我在一个社区的网站看到的,介绍了一点资讯在mtl上的优化,比较在意的就是在loss权衡,毕…
作者:铁心核桃 链接:https://www.zhihu.com/question/448924025/ans…
OGD 基本概念 OGD ( online gradient descent ) 是传统梯度下降的 onlin…