在看一个大佬向量的解释时候提到召回中的向量的解耦,看完之后有所感触,回想 DSSM 中的实现,跟这描述似乎完全…
shapley values 这个想法最初来自1953年Lloyd Shaley 提出的IDEA,下面会通过简…
下午的会议整的我得好好想一想。 做算法其实最头疼的一件事应该就是想特征,一版接着一版,无穷无尽的迭代下去。相比…
Xgbfi 用于训练好的xgboost模型分析对应特征的重要性,当然你也可以使用fmap来观察 What is…
简单介绍一下吧,lightgbm是微软推出的gbdt相关的机器学习库,一开源就受到很多开发者的喜爱吧,主要是运…
序列预测是当前深度学习最火热的应用之一。从搭建推荐系统到语音识别再到自然语言处理,序列预测有着广泛的应用前景。…
一般情况下对于推荐输出的召回的候选集进行排序,ltr排序这个也是大家经常使用的。 lr+gbdt 这个组合在c…
最近需要做一个国家区域的聚类分析,使用的是kmeans聚类方法,构造接近900维特征来进行聚类。使用sklea…
最近在极客时间上买了一个推荐三十六式的课程,作为一个推荐系统方面的新手,在这个课程上还是可以学习不少推荐方面的…
声明: manifold:可以称之为流形数据。像绳结一样的数据,虽然在高维空间中可分,但是在人眼所看到的低维空…
Coursera深度学习教程中文笔记 课程概述 https://mooc.study.163.com/univ…
先举个例子 上面的二部图表示user A对item a和c感兴趣,B对a b c d都感兴趣,C对c和d感兴趣…
其实吧这篇文章可写可不写,因为这个偏差和方差的问题在机器学习中算是经常遇到,大家根据不同的业务场景来做相应的取…
数据科学家花了大量的时间清洗数据集,并将这些数据转换为他们可以处理的格式。事实上,很多数据科学家声称开始获取和…
在之前的有一篇文章给出了pointwise之prank算法说明以及实现,这一篇文章会讲解pairwise。 写…
:mrgreen:博主今天跑完微马拉松,回来之后躺在沙发上就睡着了,醒来洗个澡开始学习了,网易云课堂的视频最近…
修改记录: 2017/3/22修改代码中的部分BUG 核心代码 https://github.com/zhus…
先给出一个例子抛出最大熵的问题。。 掷骰子,骰子总共有6个点数,现在你觉得每个点数掷到的概率多大? 你毫不犹豫…