详细内容或原文请订阅后点击阅览
机器学习“降临节日历”奖励 1:Excel 中的 AUC
AUC 衡量模型将正数排在负数之上的程度,与任何选定的阈值无关。机器学习“降临日历”奖励 1:Excel 中的 AUC 帖子首先出现在《走向数据科学》上。
来源:走向数据科学,我们将在Excel中实现AUC。
AUC 通常用于分类任务作为性能指标。
但我们从一个混淆矩阵开始,因为这是每个人实践的起点。然后我们就会明白为什么单个混淆矩阵是不够的。
我们还将回答以下问题:
1. 为什么混淆矩阵还不够
1.1 模型得分
分类器通常会给我们分数,而不是最终的决定。当我们选择阈值时,就会做出决定。
如果您阅读了之前的“降临节日历”文章,您已经知道“分数”可能意味着不同的含义,具体取决于型号系列:
因此,无论采用哪种方法,我们最终都会遇到相同的情况:每个观察的分数。
然后,在实践中,我们选择一个阈值(通常为 0.5),并将分数转换为预测类别。
这正是混淆矩阵进入故事的地方。
1.2 某一阈值的混淆矩阵
一旦选择了阈值,每个观察结果就变成了二元决策:
由此,我们可以数出四个数字:
