问题:Youtube为什么要用这个巨大的softmax多分类来建模,而不是用p(w|user,video)的二…
这两天组里有同事在做特征分析这块的工作的时候其实会涉及到特征共线性问题,所以趁这个机会也去理解一下这个概念,说…
本文主要是参考了http://blog.echen.me/2011/07/18/introduction-to…
简单介绍一下吧,lightgbm是微软推出的gbdt相关的机器学习库,一开源就受到很多开发者的喜爱吧,主要是运…
序列预测是当前深度学习最火热的应用之一。从搭建推荐系统到语音识别再到自然语言处理,序列预测有着广泛的应用前景。…
一般情况下对于推荐输出的召回的候选集进行排序,ltr排序这个也是大家经常使用的。 lr+gbdt 这个组合在c…
最近需要做一个国家区域的聚类分析,使用的是kmeans聚类方法,构造接近900维特征来进行聚类。使用sklea…
声明: manifold:可以称之为流形数据。像绳结一样的数据,虽然在高维空间中可分,但是在人眼所看到的低维空…
其实吧这篇文章可写可不写,因为这个偏差和方差的问题在机器学习中算是经常遇到,大家根据不同的业务场景来做相应的取…
数据科学家花了大量的时间清洗数据集,并将这些数据转换为他们可以处理的格式。事实上,很多数据科学家声称开始获取和…
在之前的有一篇文章给出了pointwise之prank算法说明以及实现,这一篇文章会讲解pairwise。 写…
:mrgreen:博主今天跑完微马拉松,回来之后躺在沙发上就睡着了,醒来洗个澡开始学习了,网易云课堂的视频最近…
修改记录: 2017/3/22修改代码中的部分BUG 核心代码 https://github.com/zhus…
先给出一个例子抛出最大熵的问题。。 掷骰子,骰子总共有6个点数,现在你觉得每个点数掷到的概率多大? 你毫不犹豫…
kd 树的结构 kd树是一个二叉树结构,它的每一个节点记载了【特征坐标,切分轴,指向左枝的指针,指向右枝的指针…
最近一些列的博客尽量使用口语化的方式来把问题说明白,一般情况下能把事情说的明明白白也可以变相的说明你对问题有一…
随机森林的介绍在这篇文章中就不多介绍了,核心思想就是双随机过程:随机样本采样和随机特征采样 特征选择下面介绍两…
今天主要要说一下常见的几个优化方法分别是梯度下降、随机梯度下降、牛顿法和拟牛顿法 NO1 梯度下降 从字面意思…