Calculadora del Coeficiente de Correlación de Matthews (MCC)

Ingresa los valores de tu matriz de confusión para evaluar el rendimiento del modelo.

Proporciona los valores de Verdaderos Positivos (TP), Falsos Positivos (FP), Verdaderos Negativos (TN) y Falsos Negativos (FN) de la matriz de confusión de tu modelo. La calculadora computará el MCC y otras métricas clave de rendimiento.

Ejemplos Prácticos

Explora diferentes escenarios para entender cómo funciona el MCC.

Balanced High-Performing Model

Modelo Equilibrado de Alto Rendimiento

A scenario where the model performs well on a balanced dataset.

TP: 90, FP: 10

TN: 85, FN: 15

Imbalanced Dataset

Conjunto de Datos Desequilibrado

An example with an imbalanced dataset, where MCC is particularly useful.

TP: 95, FP: 5

TN: 9900, FN: 0

Poor Performing Model

Modelo de Bajo Rendimiento

A model that performs poorly, close to a random guess.

TP: 50, FP: 50

TN: 50, FN: 50

Perfect Prediction

Predicción Perfecta

A perfect model with no errors, resulting in the highest possible MCC score.

TP: 100, FP: 0

TN: 100, FN: 0

Otros Títulos
Entendiendo el Coeficiente de Correlación de Matthews (MCC): Una Guía Completa
Una inmersión profunda en una de las métricas más robustas para la evaluación de modelos de clasificación binaria.

1. ¿Qué es el Coeficiente de Correlación de Matthews (MCC)?

  • Definiendo el MCC
  • La Matriz de Confusión: La Base del MCC
  • Por qué el MCC es una Métrica Superior
El Coeficiente de Correlación de Matthews (MCC), también conocido como coeficiente phi, es una tasa estadística que mide la calidad de una clasificación binaria. Es ampliamente considerado como una de las medidas más equilibradas e informativas porque tiene en cuenta las cuatro entradas de la matriz de confusión: Verdaderos Positivos (TP), Verdaderos Negativos (TN), Falsos Positivos (FP) y Falsos Negativos (FN).
El MCC produce un valor entre -1 y +1. Un coeficiente de +1 representa una predicción perfecta, 0 no es mejor que aleatorio, y -1 indica total desacuerdo entre predicción y observación. A diferencia de la precisión o la puntuación F1, el MCC funciona bien incluso en conjuntos de datos desequilibrados, convirtiéndolo en una métrica más confiable en muchos escenarios del mundo real.
La Matriz de Confusión
Para entender el MCC, primero debes entender la matriz de confusión. Verdaderos Positivos (TP): Casos positivos correctamente predichos. Verdaderos Negativos (TN): Casos negativos correctamente predichos. Falsos Positivos (FP): Casos positivos incorrectamente predichos (un error 'Tipo I'). Falsos Negativos (FN): Casos negativos incorrectamente predichos (un error 'Tipo II').
Ventajas del MCC
Datos Desequilibrados: Proporciona una puntuación justa incluso si el número de muestras negativas y positivas son muy diferentes. Simetría: Es una métrica simétrica, lo que significa que no importa qué clase se etiquete como 'positiva'. Intercambiar las clases positiva y negativa resulta en el mismo valor de MCC. Integralidad: Es la media geométrica de los coeficientes de regresión del problema y su dual, resumiendo el rendimiento en un solo valor.

2. Derivación Matemática y Fórmula

  • La Fórmula del MCC
  • Interpretando el Resultado
  • Manejando Casos Extremos
El MCC se calcula directamente de los cuatro valores de la matriz de confusión usando una fórmula específica.
La Fórmula
MCC = (TP TN - FP FN) / sqrt((TP + FP) (TP + FN) (TN + FP) * (TN + FN))
El numerador, TP * TN - FP * FN, esencialmente mide la covarianza entre los valores predichos y reales. Un valor positivo grande significa que las predicciones se alinean bien con la realidad. El denominador es un factor de normalización, escalando el resultado entre -1 y +1. Es la media geométrica de las cuatro sumas de filas y columnas de la matriz de confusión.
Caso Extremo: Cero en el Denominador
Un caso extremo crucial ocurre si cualquiera de las cuatro sumas en el denominador es cero (ej., el modelo siempre predice 'positivo', haciendo que TN + FP = 0). En esta situación, el denominador se convierte en cero, lo que llevaría a un error de división por cero. Por convención, el MCC se define como 0 en tales casos, reflejando que el modelo no tiene poder predictivo.

3. Guía Paso a Paso para Usar la Calculadora

  • Recopilando Tus Datos
  • Ingresando los Valores
  • Interpretando la Salida
Paso 1: Obtener Valores de la Matriz de Confusión
Antes de usar la calculadora, necesitas tener los resultados de tu modelo de clasificación binaria resumidos en una matriz de confusión. Esto significa que necesitas cuatro números: Verdaderos Positivos (TP), Falsos Positivos (FP), Verdaderos Negativos (TN) y Falsos Negativos (FN).
Paso 2: Ingresar los Valores
Ingresa cada uno de estos cuatro valores en los campos correspondientes de la calculadora. Los campos están claramente etiquetados. Asegúrate de estar ingresando enteros no negativos.
Paso 3: Calcular y Analizar
Haz clic en el botón 'Calcular'. La herramienta proporcionará instantáneamente el Coeficiente de Correlación de Matthews (MCC). Junto con el MCC, también computará otras métricas útiles como Precisión, Precisión, Sensibilidad, Especificidad y la Puntuación F1, dándote una imagen completa del rendimiento de tu modelo.

Ejemplo de Cálculo

  • Sea TP = 90, FP = 5, TN = 85, FN = 10.
  • Numerador = (90 * 85) - (5 * 10) = 7650 - 50 = 7600.
  • Denominador = sqrt((90+5)*(90+10)*(85+5)*(85+10)) = sqrt(95 * 100 * 90 * 95) = sqrt(81,225,000) ≈ 9012.49
  • MCC = 7600 / 9012.49 ≈ 0.843

4. Aplicaciones del Mundo Real del MCC

  • Diagnóstico Médico
  • Bioinformática
  • Detección de Fraude Financiero
Diagnóstico Médico
En las pruebas médicas, identificar con precisión a los pacientes con una enfermedad (verdaderos positivos) y sin una enfermedad (verdaderos negativos) es crítico. Debido a que el número de individuos sanos a menudo supera con creces el número de individuos enfermos (un conjunto de datos desequilibrado), el MCC es una excelente métrica para evaluar el rendimiento de las pruebas diagnósticas, ya que no se ve sesgado por el gran número de verdaderos negativos.
Bioinformática
El MCC se usa ampliamente en bioinformática para tareas como predecir estructuras secundarias de proteínas. La predicción es una tarea de clasificación (ej., hélice, lámina, o bobina), y el MCC proporciona una forma estándar de medir la calidad de estas predicciones.
Detección de Fraude Financiero
En la detección de fraude, las transacciones fraudulentas (la clase 'positiva') son muy raras en comparación con las legítimas. La precisión sería una métrica engañosa, ya que un modelo que siempre predice 'no fraude' tendría una precisión muy alta. El MCC proporciona una evaluación mucho más realista de la capacidad de un modelo de detección de fraude para distinguir entre actividades fraudulentas y legítimas.

5. Conceptos Erróneos Comunes y Métodos Correctos

  • Precisión vs. MCC
  • Puntuación F1 vs. MCC
  • Cuándo Usar MCC
Concepto Erróneo: 'Alta Precisión Significa un Buen Modelo'
Esta es la falacia más común, especialmente con datos desequilibrados. Como se mencionó en el ejemplo de detección de fraude, un modelo puede lograr más del 99% de precisión simplemente adivinando la clase mayoritaria. El MCC evita esta trampa incorporando el equilibrio de las cuatro celdas de la matriz de confusión, proporcionando una puntuación cercana a cero para tal modelo ingenuo.
Concepto Erróneo: 'La Puntuación F1 es Siempre Suficiente'
La puntuación F1 es la media armónica de precisión y sensibilidad y es una gran métrica. Sin embargo, ignora los Verdaderos Negativos. Esto puede ser problemático. Por ejemplo, en una prueba médica para una enfermedad rara, el número de verdaderos negativos (personas sanas correctamente identificadas) es una pieza de información muy importante que la puntuación F1 pasa por alto. El MCC, por el contrario, usa las cuatro celdas y así proporciona un resumen más completo.
¿Cuándo Deberías Priorizar el MCC?
Deberías considerar el MCC como tu métrica principal siempre que estés tratando con una tarea de clasificación binaria, pero se vuelve especialmente crucial cuando tu conjunto de datos está desequilibrado. Su capacidad para proporcionar un resumen único, interpretable y equilibrado del rendimiento lo convierte en una herramienta indispensable para científicos de datos e investigadores.