NCE评测指标理解

3,068次阅读
没有评论

共计 644 个字符,预计需要花费 2 分钟才能阅读完成。

NCE评测指标是facebook以前提出的一个评测ctr模型的指标,中文翻译一下就是归一化交叉信息熵,在提到归一化之前,基本上ctr模型都是交叉熵作为模型优化的loss。先给出归一化交叉熵原文的介绍。

NCE评测指标理解

原文关于这个的解释我有点翻译不过来,偷懒直接贴图了。有兴趣的可以直接看这个图。

看公示的理解,不是难理解,分子就是预估的交叉熵,p_i是模型预估的pctr,分母是真实的交叉熵,p就是样本的真实的ctr。

ok,一开始看到这我其实还不太理解这个的含义,觉得这个只是做了一个标准化,有什么意义?

第一步假设p_i跟真实的p是一模一样相等,那么意味分子分母的值就是一样的了,这个是怎么计算的?

计算的方式就是外边的求和相拆分到里面去,下面给出前面一项的举例说明:

-\frac{1}{N}\sum_{i=1}^{n}\frac{1+y_i}{2}log(p_i)=-p*log(p)

那这样的含义是什么?如果出现这样,那么所有的正负样本的预估值都是一样的,那么就没有任何意义了,模型也是懒得不行了。这应该是最差的情况了。这个时候计算的归一化交叉熵就是1,所以如果你模型得到的值是这样的话应该是有问题。

那么它对应的一个极端的情况就是,每一个样本都是完完全全预估正确,那么对应的分子就是 0了,所以得到的值就是 0,所以这个NCE的范围应该是在0-1之间。理论上数值越小越好,越接近于 0的极端就是完全预估正确当然是更好啰。

以上就是自己看了之后一些理解,没有照搬原文的翻译,希望能帮助理解吧!

正文完
请博主喝杯咖啡吧!
post-qrcode
 
admin
版权声明:本站原创文章,由 admin 2021-12-06发表,共计644字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码