分类准确率指标的数学基础源自概率论与统计推断,为性能评估和比较提供严谨框架。
数学基础:
准确率:A = (TP + TN) / N,其中N = TP + FP + TN + FN为总样本数。这表示正确分类的概率:P(正确) = P(正类且预测为正) + P(负类且预测为负)。
精确率:P = TP / (TP + FP) = P(实际为正 | 预测为正)。该条件概率用贝叶斯定理框架衡量正例预测的可靠性。
召回率(灵敏度):R = TP / (TP + FN) = P(预测为正 | 实际为正)。该指标衡量真正例率,与假设检验中的统计功效相关。
特异性:S = TN / (TN + FP) = P(预测为负 | 实际为负)。该指标衡量真反例率,是ROC分析中灵敏度的补充。
F1分数:F1 = 2PR / (P + R) = 2TP / (2TP + FP + FN)。该调和平均数在类别不平衡时,能平衡精确率与召回率,尤为有用。
高级统计关系:
- ROC分析:真正例率(召回率)与假正例率(1-特异性)在不同分类阈值下提供全面性能可视化。
- 信息论:预测与实际类别之间的互信息用熵度量分类性能。
- 置信区间:对于准确率A和样本量n,95%置信区间约为A ± 1.96√(A(1-A)/n),可用于统计显著性检验。
多分类扩展:
- 宏平均:分别计算每个类别的指标后取平均:宏精确率 = (1/k)Σ 精确率_i,k为类别数。
- 微平均:将所有类别的TP、FP、FN汇总后计算:微精确率 = Σ TPi / (Σ TPi + Σ FP_i)。
- 加权指标:按类别频率加权处理类别不平衡:加权精确率 = Σ (ni/n) × 精确率i,n_i为第i类样本数。