又是一年年底,年终述职总结刚刚完成了,这一年有不足也有进步,新的一年继续加油。先从整理资料开始吧! 之前的工作…
前言 美团技术博客最近出了一篇文章讲多任务学习,优化的对象是深层转化。 上图是论文中给出的一个深层转化的过程图…
问题:Youtube为什么要用这个巨大的softmax多分类来建模,而不是用p(w|user,video)的二…
在看一个大佬向量的解释时候提到召回中的向量的解耦,看完之后有所感触,回想 DSSM 中的实现,跟这描述似乎完全…
新业务线上现在有很多种召回策略,在线和离线都有,使用深度召回期望能召回与用户更相关并且感兴趣的物品。这几天页研…
这个是一个朋友面试时遇到的问题,这个问题个人觉得算是一个开放性的问题,同时需要你对深度学习有着宏观的认识,并且…
tf2.0是要力推keras,最近将之前的代码改造成keras(挤时间自己改的,还在测试),这中间看着kera…
Bert 最近很火,应该是最近最火爆的 AI 进展,网上的评价很高,那么 Bert 值得这么高的评价吗?我个人…
在CTR预估领域出现了很多模型,之前看过一篇微信文章讲述十大经典CTR模型,DCN就是其中一个模型,估计很多公…
现在TensorFlow是机器学习中最常用的库之一。有时,描述张量图可能是非常有用的,并且知道什么操作需要更多…
这个文章阿里妈妈最近公开的,但是这个算法在MTL领域应该大家都已经使用,只是没人公布出来,如果你多看看MTL的…
之前使用的horovod就是使用ring allreduce的方法实现深度学习并行计算优化,这篇文章主要来源于…
在写这篇文章之前,压根就没使用过 tensorflow 分布式学习,以前日常工作的数据量也不需要这么大的计算资…
最近换了新坑,组里的tensorflow版本基本上都赶到了最新的1.13版本了,我最近写的代码都是基于1.13…
本文简单介绍梯度裁剪(gradient clipping)的方法及其作用,不管在RNN或者在其他网络都是可以使…
输入管道性能指南 GPU 和 TPU 可以从根本上缩短执行单个训练步骤所需的时间。为了实现最佳性能的目的,我们…
GraphKeys tf.GraphKeys包含所有graph collection中的标准集合名,有点像Py…
最近使用keras写了一点代码,输入是正负样本,loss使用的是交叉熵,但是最终我只需要网络对给定的样本的预测…