笛卡尔积特征组合

7,023次阅读
没有评论

共计 468 个字符,预计需要花费 2 分钟才能阅读完成。

特征组合也是特征工程中经常使用的构造新特征的方法,如果你的组合特征基数比较大的化,就不建议使用笛卡尔积的方法了,因为构造的结果是指数级的,组合太多对结果的效果不一定好

(注意本文的红字部分吧,好多人知道怎么去构造,那么对应的特征值如何获取,自己在网上搜了搜资料不是太多)

特征组合是一个充满了智慧和经验的领域,花样繁多,令人赞叹。这里说一种常规的方法:笛卡尔积。

在数学中,两个集合X和Y的笛卡儿积(Cartesian product),又称直积,在集合论中表示为X × Y,是所有可能的有序对组成的集合,其中有序对的第一个对象是X的成员,第二个对象是Y的成员。

其实之前我们已经了解特征组合了,在哪里呢?嘿嘿,还记得那位“喜欢买鞋的女性”用户吗,让我们看看在特征层面如何表示这种信息。假设我们有一个特征,叫做商品类别{1:上衣, 2:裙裤, 3:鞋, 4:其他}, 还有一个特征是用户性别{1:男, 2:女, 3:不详}。通过笛卡尔积,我们可以得到新特征“喜欢买鞋的女性”{(商品类别:鞋), (性别:女)},至于特征值嘛,一般常见的操作就是加减乘除对数之类的。

正文完
请博主喝杯咖啡吧!
post-qrcode
 
admin
版权声明:本站原创文章,由 admin 2018-02-27发表,共计468字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码