分类模型评估

分类模型评估

准确率（Accuracy）：预测正确的样本数占样本总数的比例

混淆矩阵（核心视角）

TP：正类预测为正
FP：负类预测为正
TN：负类预测为负
FN：正类预测为负

常用指标

精确率（Precision）：预测为正的样本里，有多少是真的正
召回率（Recall）：真实为正的样本里，有多少被找出来了
F1-score：Precision 与 Recall 的折中（调和平均）
ROC-AUC：衡量模型在不同阈值下的整体区分能力

什么时候不要只看准确率

类别不平衡时（例如 99% 都是负类），高准确率可能没有意义
应结合业务成本选择阈值，并用 Precision/Recall/F1/AUC 等指标评估