La evaluación de un modelo es uno de los pasos más importantes en el proceso de Machine Learning, ya que nos va a permitir saber cómo de bueno es nuestro modelo, cuánto ha aprendido de la muestra de entrenamiento (train
) y cómo procederá para datos nunca vistos o nuevos (test
y/o validación
).
Para evaluar un modelo existen ciertos conjuntos de métricas, que se distinguen según si un modelo permite clasificar o realizar una regresión.
Un modelo de clasificación se utiliza para predecir una categoría o la clase de una observación. Por ejemplo, podríamos tener un modelo que predijese si un correo electrónico es spam (1) o no spam (0), o si una imagen contiene un perro, un gato o un pájaro. Los modelos de clasificación son útiles cuando la variable de salida es categórica.
Las métricas que se pueden aplicar a este tipo de modelos son las siguientes:
Un modelo de regresión se utiliza para predecir un valor continuo. Por ejemplo, podríamos tener un modelo de regresión que prediga el precio de una casa basado en características como su tamaño, el número de habitaciones y su ubicación. Los modelos de regresión son útiles cuando la variable de salida es continua y numérica.
Las métricas que se pueden aplicar a este tipo de modelos son las siguientes:
El paquete scikit-learn
permite fácilmente aplicar estas funciones a los modelos. La documentación está accesible aquí.