Calculadora de Curva ROC y AUC

Pruebas Estadísticas Avanzadas

Introduce las puntuaciones de predicción de tu modelo y las etiquetas verdaderas a continuación para generar una curva ROC y calcular el Área Bajo la Curva (AUC).

Ejemplos Prácticos

Haz clic en un ejemplo para cargar sus datos en la calculadora.

Modelo de Detección de Cáncer

Diagnóstico Médico

Evaluando un modelo que predice la probabilidad de que un tumor sea maligno (1) o benigno (0).

Etiqueta Positiva: 1

Etiqueta Negativa: 0

0.95,1
0.85,1
0.80,0
0.70,1
0.55,1
0.45,0
0.40,1
0.30,0
0.25,0
0.10,0

Predicción de Incumplimiento Crediticio

Riesgo Financiero

Evaluando un modelo que calcula la probabilidad de que un cliente incumpla un préstamo ('default') vs. no incumplir ('paid').

Etiqueta Positiva: default

Etiqueta Negativa: paid

0.88,default
0.76,paid
0.71,default
0.65,paid
0.61,paid
0.52,default
0.41,paid
0.39,default
0.22,paid
0.15,paid

Filtro de Correo No Deseado

Marketing

Probando un filtro que puntúa correos electrónicos según su probabilidad de ser spam ('spam') vs. no spam ('ham').

Etiqueta Positiva: spam

Etiqueta Negativa: ham

0.99,spam
0.91,spam
0.82,ham
0.75,spam
0.63,ham
0.51,spam
0.49,ham
0.33,ham
0.21,spam
0.11,ham

Separación Ideal

Clasificador Perfecto

Un ejemplo de un clasificador perfecto donde todas las muestras positivas tienen puntuaciones más altas que todas las muestras negativas.

Etiqueta Positiva: 1

Etiqueta Negativa: 0

0.9,1
0.8,1
0.7,1
0.6,1
0.5,1
0.4,0
0.3,0
0.2,0
0.1,0
0.05,0
Otros Títulos
Entendiendo la Curva ROC: Una Guía Completa
Una mirada profunda a la curva ROC, AUC y su importancia en la evaluación de modelos de clasificación.

¿Qué es una Curva ROC?

  • Los Fundamentos de la Clasificación
  • Verdaderos Positivos vs. Falsos Positivos
  • Visualizando el Rendimiento
Una curva de Característica Operativa del Receptor (ROC) es un gráfico que ilustra la capacidad diagnóstica de un sistema clasificador binario a medida que varía su umbral de discriminación. La curva se crea trazando la Tasa de Verdaderos Positivos (TPR) contra la Tasa de Falsos Positivos (FPR) en varios ajustes de umbral.
Componentes Clave de una Curva ROC
Las dos métricas fundamentales que forman la curva ROC son la Tasa de Verdaderos Positivos (Sensibilidad) y la Tasa de Falsos Positivos. TPR mide la proporción de positivos reales que se identifican correctamente como tales. FPR mide la proporción de negativos reales que se identifican incorrectamente como positivos. Un clasificador ideal tendría una TPR de 1 y una FPR de 0, correspondiendo a la esquina superior izquierda del espacio ROC.

Guía Paso a Paso para Usar la Calculadora de Curva ROC

  • Formato de Datos
  • Definiendo Clases
  • Interpretando los Resultados
Usar esta calculadora es sencillo. Primero, prepara tus datos. Deben consistir en dos columnas o partes por línea: la puntuación de predicción de tu modelo y la etiqueta verdadera real.
1. Introduciendo Datos
Copia y pega tus datos en el área de texto principal. Cada entrada debe estar en una nueva línea, con la puntuación y etiqueta separadas por una coma (ej., 0.85,1).
2. Especificando Etiquetas
En los campos 'Etiqueta de Clase Positiva' y 'Etiqueta de Clase Negativa', introduce el texto o número exacto que representa tus clases positivas y negativas (ej., '1' y '0', o 'spam' y 'ham'). Es sensible a mayúsculas y minúsculas.
3. Cálculo y Análisis
Haz clic en 'Calcular'. La herramienta mostrará el Área Bajo la Curva (AUC), identificará el umbral óptimo para la clasificación basado en la estadística J de Youden, y proporcionará la sensibilidad y especificidad en ese umbral. También genera los puntos (FPR, TPR) necesarios para trazar la curva ROC tú mismo.

La Importancia del Área Bajo la Curva (AUC)

  • AUC como Métrica de Rendimiento
  • Interpretando Valores de AUC
  • Limitaciones de AUC
El Área Bajo la Curva (AUC) es la métrica más importante derivada de la curva ROC. Proporciona una medida agregada del rendimiento a través de todos los umbrales de clasificación posibles. AUC representa la probabilidad de que el clasificador clasifique una instancia positiva elegida al azar más alta que una instancia negativa elegida al azar.
Cómo Interpretar Valores de AUC
Los valores de AUC van de 0 a 1, donde un valor más alto indica mejor rendimiento. Un AUC de 1.0 representa un clasificador perfecto. Un AUC de 0.5 sugiere ninguna capacidad de discriminación, equivalente a adivinar al azar. Un AUC menor a 0.5 indica que el modelo está funcionando peor que adivinar al azar.

Guía General de Interpretación de AUC

  • AUC = 1.0: Clasificador perfecto.
  • AUC > 0.9: Excepcional.
  • AUC > 0.8: Excelente.
  • AUC > 0.7: Aceptable.
  • AUC = 0.5: Sin valor predictivo (azar).
  • AUC < 0.5: Peor que el azar.

Aplicaciones del Mundo Real del Análisis ROC

  • Diagnósticos Médicos
  • Finanzas y Puntuación Crediticia
  • Selección de Modelos de Aprendizaje Automático
Diagnósticos Médicos
En medicina, las curvas ROC se usan para evaluar el rendimiento de pruebas diagnósticas. Por ejemplo, se podría desarrollar una prueba para detectar una cierta enfermedad basada en el nivel de un biomarcador. La curva ROC ayuda a determinar el punto de corte óptimo para ese nivel de biomarcador para maximizar los verdaderos positivos mientras se minimizan los falsos positivos.
Finanzas y Puntuación Crediticia
Los bancos usan modelos de puntuación para predecir si un solicitante de préstamo incumplirá. El análisis ROC les ayuda a elegir un umbral de puntuación crediticia que equilibre el riesgo de prestar a un mal solicitante (falso positivo) contra la oportunidad perdida de denegar a un buen solicitante (falso negativo).

Derivación Matemática y Encontrando el Umbral Óptimo

  • Calculando TPR y FPR
  • Construyendo la Curva
  • Estadística J de Youden
Para construir una curva ROC, los datos se ordenan primero por la puntuación del modelo en orden descendente. Luego, cada puntuación única se trata como un umbral potencial. Para cada umbral, clasificamos todas las instancias con puntuaciones por encima como 'positivas' y por debajo como 'negativas'.
Fórmulas para TPR y FPR
TPR = TP / (TP + FN) y FPR = FP / (FP + TN), donde TP son Verdaderos Positivos, FN son Falsos Negativos, FP son Falsos Positivos, y TN son Verdaderos Negativos.
Estadística J de Youden
Para encontrar el umbral 'óptimo', esta calculadora usa la estadística J de Youden. Se define para cada punto en la curva ROC como J = Sensibilidad + Especificidad - 1 (o TPR - FPR). El umbral que maximiza este valor se considera óptimo ya que representa el punto más alejado de la línea de no-discriminación (la línea diagonal).