El fundamento matemático de las métricas de precisión de clasificación deriva de la teoría de probabilidad y la inferencia estadística, proporcionando marcos rigurosos para evaluación y comparación de rendimiento.
Fundamentos Matemáticos:
Precisión: A = (VP + VN) / N, donde N = VP + FP + VN + FN es el tamaño total de muestra. Esto representa la probabilidad de clasificación correcta: P(Correcto) = P(Positivo ∩ Predicho Positivo) + P(Negativo ∩ Predicho Negativo).
Precisión: P = VP / (VP + FP) = P(Positivo Real | Predicho Positivo). Esta probabilidad condicional mide la confiabilidad de predicciones positivas usando el marco del teorema de Bayes.
Sensibilidad: R = VP / (VP + FN) = P(Predicho Positivo | Positivo Real). Esto mide la tasa de verdaderos positivos y se relaciona con el poder estadístico en pruebas de hipótesis.
Especificidad: S = VN / (VN + FP) = P(Predicho Negativo | Negativo Real). Esto mide la tasa de verdaderos negativos y complementa la sensibilidad en análisis ROC.
Puntuación F1: F1 = 2PR / (P + R) = 2VP / (2VP + FP + FN). Esta media armónica proporciona una sola métrica que equilibra precisión y sensibilidad, particularmente valiosa para conjuntos de datos desequilibrados.
Relaciones Estadísticas Avanzadas:
- Análisis ROC: Tasa de Verdaderos Positivos (Sensibilidad) vs. Tasa de Falsos Positivos (1-Especificidad) proporciona visualización integral de rendimiento a través de umbrales de clasificación.
- Teoría de Información: La información mutua entre predicciones y clases reales cuantifica el rendimiento de clasificación usando medidas de entropía.
- Intervalos de Confianza: Para precisión A con tamaño de muestra n, el intervalo de confianza del 95% es aproximadamente A ± 1.96√(A(1-A)/n), permitiendo pruebas de significancia estadística.
Extensiones Multiclase:
- Promediado Macro: Calcula métricas para cada clase por separado, luego promedia: Precisiónmacro = (1/k)Σ Precisióni para k clases.
- Promediado Micro: Agrega todos los VP, FP, FN a través de clases, luego calcula: Precisiónmicro = Σ VPi / (Σ VPi + Σ FPi).
- Métricas Ponderadas: Pondera cada clase por su frecuencia para manejar desequilibrio de clases: Precisiónponderada = Σ (ni/n) × Precisióni donde ni es el número de muestras en la clase i.