spark对python开放的接口实在是有限,只有scala是亲生的。查了下scala的包和函数,发现提供的真…
前言 如果直接通过pip install tensorflow安装Tensorflow的话,在运行时可能会有这…
今年1月,Keras作者、谷歌AI研究员François Chollet在推特上发出召唤:讲中文的Keras用…
深度学习目前基本上已经被很多行业使用,博主每天也会逛技术论坛或者sf等网站都会对此有有很多的文章讨论,从工作以…
前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数…
slopeone原理 Slope One 是一种很简单的类比类似的算法, 其实大体意思 就是A B 不同的用…
最近隔壁的小伙伴跑模型出现了类似以下的错误,当然最主要的错误在下面的红色标识出来 client token: …
Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce, Shuff…
上一篇文章使用基于模型的方法进行特征选择,其中主要描述了使用正则项、lasso等方法实现的特征选择,这篇文章是…
上一篇讲解了使用基于递归消除法,从大范围来讲是通过wrapper的方法,中文就是包装的方法,递归消除是这其中主…
上一篇文章使用最大信息系数筛选特征,本篇使用递归消除法筛选特征。 递归消除法,首先递归肯定是要循环执行多次来筛…
上一篇使用卡方系数进行特征选择,使用的是假设检验的思路,这篇文章使用最大信息系数的方法进行计算。 为什么要使用…
上一篇说明从皮尔逊系数选择,这次使用卡方检验的方法来选择特征,使用假设检验的方式。 首先还是从卡方检验的原理,…
上一篇文章讲到使用方差选择特征,这篇文章主要是使用pearson系数进行特征选择 使用相关系数法,先要计算各个…
方差选择法当然是使用方差来衡量特征,处理的维度是特征维度,计算当前的特征的方差大小,根据设定的方差阈值选取出大…
特征选择在机器学习中占据了重要的地位,通常在构造完特征之后会发现很多特征,少则十几个多则几十个,其实这些特征并…
上一篇讲解了使用哑编码的方式来进行数据预处理,这篇文章看起来只是用来作为数据类型的转换,比如多项式操作或者自定…
上一篇讲解了数据二值化处理,这篇讲解数据的哑编码 哑编码概念 先来讲解下哑编码的概念吧,当你的变量不是定量特征…