Aprendizaje activo (algoritmo de aprendizaje activo)

El aprendizaje activo, en un contexto de IA, es la capacidad de un algoritmo de aprendizaje automático (ML) para consultar una fuente humana en busca de información adicional. Esencialmente, el aprendizaje activo permite que un programa de inteligencia artificial mínimamente entrenado identifique qué datos necesita para mejorar. TEl algoritmo identifica qué subconjunto de datos espera que produzca los mejores resultados para una categoría en particular y solicita que alguien etiquete los datos en ese subconjunto. 

Los algoritmos de aprendizaje activo requieren datos de entrenamiento mínimos, lo que los hace especialmente útiles cuando no hay muchos datos etiquetados disponibles. Esto hace que este tipo de algoritmo sea útil para la recuperación de información y el análisis de texto, así como para el reconocimiento de imágenes y voz.

Aprendizaje activo versus aprendizaje supervisado versus aprendizaje no supervisado

Los algoritmos de aprendizaje activo son una forma simple de IA curiosa y semi-supervisada. Este tipo de algoritmo combina aspectos tanto del aprendizaje supervisado como del aprendizaje no supervisado.

El ML supervisado, que utiliza datos históricos para realizar pronósticos sobre nuevos datos, requiere que un ser humano cree los datos de entrada y salida deseados para el entrenamiento. Debido a que este enfoque requiere una gran cantidad de gastos humanos, puede ser costoso. Por el contrario, los sistemas de inteligencia artificial que utilizan el aprendizaje no supervisado requieren muy poca sobrecarga humana porque los algoritmos simplemente buscan patrones en conjuntos de datos sin etiquetar. Si bien este tipo de NM puede ser rentable porque no requiere tanta participación humana, también puede ser difícil cuantificar los resultados como significativos. 

El aprendizaje activo puede utilizar datos estructurados y no estructurados de una manera rentable al priorizar qué datos confunden más al modelo y solicitar etiquetas solo para esos datos. El modelo utilizará una cantidad relativamente pequeña de datos etiquetados para el entrenamiento y solicitará más etiquetas más adelante si es necesario. Este enfoque iterativo del aprendizaje automático no solo ayuda al modelo de aprendizaje automático a aprender más rápido, sino que también reduce los costos al permitir que los humanos omitan etiquetar datos que no son útiles para el modelo.

Vea este tutorial introductorio sobre el aprendizaje activo para obtener más información.