共计 468 个字符,预计需要花费 2 分钟才能阅读完成。
特征组合也是特征工程中经常使用的构造新特征的方法,如果你的组合特征基数比较大的化,就不建议使用笛卡尔积的方法了,因为构造的结果是指数级的,组合太多对结果的效果不一定好
(注意本文的红字部分吧,好多人知道怎么去构造,那么对应的特征值如何获取,自己在网上搜了搜资料不是太多)
特征组合是一个充满了智慧和经验的领域,花样繁多,令人赞叹。这里说一种常规的方法:笛卡尔积。
在数学中,两个集合X和Y的笛卡儿积(Cartesian product),又称直积,在集合论中表示为X × Y,是所有可能的有序对组成的集合,其中有序对的第一个对象是X的成员,第二个对象是Y的成员。
其实之前我们已经了解特征组合了,在哪里呢?嘿嘿,还记得那位“喜欢买鞋的女性”用户吗,让我们看看在特征层面如何表示这种信息。假设我们有一个特征,叫做商品类别{1:上衣, 2:裙裤, 3:鞋, 4:其他}, 还有一个特征是用户性别{1:男, 2:女, 3:不详}。通过笛卡尔积,我们可以得到新特征“喜欢买鞋的女性”{(商品类别:鞋), (性别:女)},至于特征值嘛,一般常见的操作就是加减乘除对数之类的。
正文完
请博主喝杯咖啡吧!