El fundamento matemático del análisis de matriz de confusión proporciona el marco riguroso para evaluación cuantitativa del rendimiento de clasificación en diversos dominios.
Formulaciones de Métricas Principales:
Exactitud = (VP + VN) / (VP + FP + VN + FN) mide la corrección general como la proporción de predicciones correctas entre las predicciones totales.
Precisión = VP / (VP + FP) cuantifica la proporción de predicciones positivas que fueron realmente correctas, respondiendo "De todas las predicciones positivas, ¿cuántas fueron correctas?"
Sensibilidad = VP / (VP + FN) mide la proporción de casos positivos reales identificados correctamente, respondiendo "De todos los positivos reales, ¿cuántos encontramos?"
Especificidad = VN / (VN + FP) cuantifica la proporción de casos negativos reales identificados correctamente, complementando la sensibilidad para evaluación completa.
Puntuación F1 = 2 × (Precisión × Sensibilidad) / (Precisión + Sensibilidad) proporciona la media armónica de precisión y sensibilidad, dando igual peso a ambas métricas.
Métricas Avanzadas y Extensiones:
Coeficiente de Correlación de Matthews (MCC) = (VP×VN - FP×FN) / √[(VP+FP)(VP+FN)(VN+FP)(VN+FN)] proporciona una medida equilibrada incluso para conjuntos de datos desequilibrados.
Exactitud Equilibrada = (Sensibilidad + Especificidad) / 2 ajusta la exactitud para conjuntos de datos desequilibrados promediando las exactitudes de cada clase.
Para problemas multiclase, las matrices de confusión se extienden a tablas n×n, con métricas calculadas usando enfoques uno-contra-todos o uno-contra-uno para cada clase individualmente.