共计 745 个字符,预计需要花费 2 分钟才能阅读完成。
前言
这一讲算是粗排后续的总结篇,之前三讲的时候就已经介绍了粗排层的整体设计方案。
你真的需要粗排?
一般情况下都是物料特别多的时候。。。
真的需要,那就看看粗排的改进
1、数据本身的迭代,都说数据是模型的天花板
2、模型本身的迭代,比如之前说到的双塔模型本身的迭代,比如wide&deep的双塔,这块关于双塔迭代知乎上有篇石塔西文章可以参考。
3、粗排学习精排的序,粗排精排化,从阿里的cold来看,这个方向也是一个趋势
4、回归粗排本身,这就是关注到粗排到本身只是构建一个topk集合
但是目前到现状都是在1,2,3发力,至于4也是一个方向。
闲聊双塔
1、最近在冷启动这块,看到了一个2017年的论文 DropoutNet ,其实这个的架构也是一个双塔的架构,这里无非在输入和中间结构上有点改动,但是还是分成用户塔和物料塔,这个网络是通过dropout的方式,淡化行为交互信息,以自身属性为出发点,说白了就是基于基础属性做的冷启动推荐。然而这一点不就是契合冷启动嘛!
2、召回模块,大名鼎鼎的dssm和YouTube DNN网络都是召回届经典的网络,然后AirBnb 和 Facebook 都做了一些改进,AirBnb从业务的角度出发详细介绍他们在数据方面的trick,值得借鉴思考。Facebook整了多个塔,两个不够,多个来添。之前张俊林老师来我司交流对比学习的时候,有同学也提到了这个多塔是否有必要,张老师的回答是没觉得多塔有什么创新,是不是该试试senet了,嘿嘿
3、粗排,在之前的几个文章讲的比较详细可以去看看
这里只是简单的介绍了双塔的一些适用场景,改进的方法在上一段的也提到过,有兴趣的可以看看。
总结
在一个大规模的推荐系统中,粗排一般情况下都是在的,之前的聊的的一些方法还是需要AB测试来告诉我们最后的答案。