共计 574 个字符,预计需要花费 2 分钟才能阅读完成。
上一篇文章讲到使用方差选择特征,这篇文章主要是使用pearson系数进行特征选择
使用相关系数法,先要计算各个特征对目标值的相关系数以及相关系数的P值
相关系数的计算公式如下:
s=\frac{\sum_{i=0}^{n}(x_i-\overline{x})*(y_i-\overline{y})}{\sqrt{\sum_{i=0}^{n}(x_i-\overline{x})^2*\sum_{i=0}^{n}(y_i-\overline{y})^2}}
sklearn函数
from sklearn.feature_selection import SelectKBest
from scipy.stats import pearsonr
from numpy import vstack, array, nan
SelectKBest(lambda X, Y: tuple(map(tuple,array(list(map(lambda x:pearsonr(x, Y), X.T))).T)), k=2).fit_transform(irisdata.data, irisdata.target)
部分实验结果如下
array([[ 1.4, 0.2],
[ 1.4, 0.2],
[ 1.3, 0.2],
[ 1.5, 0.2],
[ 1.4, 0.2],
[ 1.7, 0.4],
[ 1.4, 0.3],
[ 1.5, 0.2],
正文完
请博主喝杯咖啡吧!