Matriz de confusión

Una matriz de confusión es una tabla que describe diferentes predicciones y resultados de pruebas y los contrasta con valores del mundo real. Las matrices de confusión se utilizan en estadísticas, minería de datos, modelos de aprendizaje automático y otras aplicaciones de inteligencia artificial (IA). Una matriz de confusión también se puede llamar matriz de errores.

Las matrices de confusión se utilizan para agilizar el análisis en profundidad de los datos estadísticos y facilitar la lectura de los resultados a través de una visualización clara de los datos. Las tablas pueden ayudar a analizar fallas en estadísticas, minería de datos, análisis forense y pruebas médicas. Un análisis exhaustivo ayuda a los usuarios a decidir qué resultados indican cómo se cometen los errores en lugar de simplemente evaluar el rendimiento.

Las matrices de confusión utilizan un formato simple para registrar predicciones. En las filas de una matriz de confusión para un modelo de aprendizaje automático, las posibles predicciones se alinean en el lado derecho y las realidades en la parte superior. En las filas debajo de las realidades, se registran las predicciones o los resultados. Los resultados pueden incluir la indicación correcta de un positivo como verdadero positivo o de un negativo como verdadero negativo, así como un positivo incorrecto como falso positivo o un negativo incorrecto como falso negativo.

A continuación, se muestra un ejemplo simple de una matriz de confusión que podría usarse para describir los resultados de una prueba de embarazo:

Las matrices de codificación de colores brindan la capacidad de leer rápidamente varios casos en una prueba. La visualización rápida hace posible analizar el rendimiento de un modelo dado más profundamente que una puntuación e identificar tendencias que pueden ayudar a ajustar los parámetros.