分类模型评估
分类模型评估
- 准确率(Accuracy):预测正确的样本数占样本总数的比例
混淆矩阵(核心视角)
- TP:正类预测为正
- FP:负类预测为正
- TN:负类预测为负
- FN:正类预测为负
常用指标
- 精确率(Precision):预测为正的样本里,有多少是真的正
- 召回率(Recall):真实为正的样本里,有多少被找出来了
- F1-score:Precision 与 Recall 的折中(调和平均)
- ROC-AUC:衡量模型在不同阈值下的整体区分能力
什么时候不要只看准确率
- 类别不平衡时(例如 99% 都是负类),高准确率可能没有意义
- 应结合业务成本选择阈值,并用 Precision/Recall/F1/AUC 等指标评估