粗排第四讲

3,026次阅读
没有评论

共计 745 个字符,预计需要花费 2 分钟才能阅读完成。

粗排第四讲

前言

这一讲算是粗排后续的总结篇,之前三讲的时候就已经介绍了粗排层的整体设计方案。

你真的需要粗排?

一般情况下都是物料特别多的时候。。。

真的需要,那就看看粗排的改进

1、数据本身的迭代,都说数据是模型的天花板

2、模型本身的迭代,比如之前说到的双塔模型本身的迭代,比如wide&deep的双塔,这块关于双塔迭代知乎上有篇石塔西文章可以参考。

3、粗排学习精排的序,粗排精排化,从阿里的cold来看,这个方向也是一个趋势

4、回归粗排本身,这就是关注到粗排到本身只是构建一个topk集合

但是目前到现状都是在1,2,3发力,至于4也是一个方向。

闲聊双塔

1、最近在冷启动这块,看到了一个2017年的论文 DropoutNet ,其实这个的架构也是一个双塔的架构,这里无非在输入和中间结构上有点改动,但是还是分成用户塔和物料塔,这个网络是通过dropout的方式,淡化行为交互信息,以自身属性为出发点,说白了就是基于基础属性做的冷启动推荐。然而这一点不就是契合冷启动嘛!

2、召回模块,大名鼎鼎的dssm和YouTube DNN网络都是召回届经典的网络,然后AirBnb 和 Facebook 都做了一些改进,AirBnb从业务的角度出发详细介绍他们在数据方面的trick,值得借鉴思考。Facebook整了多个塔,两个不够,多个来添。之前张俊林老师来我司交流对比学习的时候,有同学也提到了这个多塔是否有必要,张老师的回答是没觉得多塔有什么创新,是不是该试试senet了,嘿嘿

3、粗排,在之前的几个文章讲的比较详细可以去看看

这里只是简单的介绍了双塔的一些适用场景,改进的方法在上一段的也提到过,有兴趣的可以看看。

总结

在一个大规模的推荐系统中,粗排一般情况下都是在的,之前的聊的的一些方法还是需要AB测试来告诉我们最后的答案。

正文完
请博主喝杯咖啡吧!
post-qrcode
 
admin
版权声明:本站原创文章,由 admin 2022-06-12发表,共计745字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码