模型评估指标:ROC曲线背后的统计学原理
· 18 min read
"没有测量就没有改进。在机器学习的世界里,如何评估模型的好坏,是比算法本身更重要的问题。" —— 2015年在老虎致远做模型评估时的深刻体会
开篇:一个医疗诊断的故事
想象你是一名医生,面前有两台不同的癌症检测设备:
- 设备A:总是说"有癌症",准确率70%
- 设备B:很少说"有癌症",但说了就对,准确率95%
哪个更好?单看准确率,设备B似乎更优秀。但如果癌症患者只占总人群的1%,设备A可能会漏掉所有的癌症患者,而设备B虽然准确率高,但可能错过了真正需要治疗的病人。
这个故事告诉我们:在不平衡数据集中,单一的评估指标往往会误导我们。