Sobreajuste

El sobreajuste es la optimización incorrecta de un modelo de inteligencia artificial (IA), donde la búsqueda de precisión va demasiado lejos y puede resultar en falsos positivos.

El sobreajuste contrasta con el desajuste, que también puede resultar en imprecisiones. El sobreajuste se suele denominar sobreentrenamiento y el desajuste como insuficiente. El sobreajuste y el desajuste arruinan la precisión de un modelo al generar observaciones de tendencias y predicciones que no siguen la realidad de los datos.

Los falsos positivos del sobreajuste pueden causar problemas con las predicciones y afirmaciones realizadas por la IA. Un ajuste inadecuado, por otro lado, puede perder datos que deberían incluirse debido a omisiones que resultan de un modelo demasiado específico. En datos invisibles, un modelo de sobreajuste cometerá errores que reflejen los de sus datos de entrenamiento. Esta inexactitud a menudo es el resultado de que el modelo comienza a intentar memorizar resultados en lugar de predecir con precisión datos que no se habían visto anteriormente.

Por ejemplo, una búsqueda de IA es para el número 1 en datos escritos a mano. Dependiendo de la claridad de la escritura, un falso positivo podría agrupar algunos 7 como 1, lo que sería un ajuste excesivo. Por el contrario, una omisión que podría resultar podría ser la falta de reconocimiento de 1 en algunos estilos de escritura a mano, lo que sería un defecto.

El sobreajuste puede ser el resultado de un sobreentrenamiento, una falta de validación, una validación incorrecta o un ajuste de pesos e intentos de optimización después de la prueba final. El sobreajuste también puede ser el resultado del uso de datos de entrenamiento que son demasiado ruidosos y que contienen información inadecuada.