Reconocimiento de entidad nombrada (NER)

El reconocimiento de entidades nombradas (NER) es una subtarea de extracción de información (IE) que busca y categoriza entidades específicas en un cuerpo o cuerpos de textos. NER también se conoce simplemente como identificación de entidad, fragmentación de entidad y extracción de entidad. NER se utiliza en muchos campos de la inteligencia artificial (IA), incluido el procesamiento del lenguaje natural (NLP) y el aprendizaje automático.

La extracción de información depende de NER para encontrar información específica, utilizando modelos que funcionan según modelos gramaticales o estadísticos. NER reconoce a las entidades primero como una de varias categorías, como personas, ubicaciones, organizaciones, expresiones, porcentajes y valores monetarios. Las categorías se abrevian: ubicación (LOC), personas (PER) y organizaciones (ORG), etc. Una vez que se reconoce la categoría de información, una utilidad de extracción de información extrae la información relacionada con la entidad nombrada y construye un documento legible por máquina a partir de ella que otras herramientas puede seguir procesando para extraer significado.

Al igual que con muchas tareas difíciles en IA, los desafíos de NER se presentan a la comunidad de desarrollo para fomentar el desarrollo de soluciones. La conferencia de comprensión de mensajes (MUC) es uno de esos desafíos. De manera comparable, los humanos obtuvieron un 97.60 por ciento y un 96.95 por ciento de precisión, mientras que el mejor sistema de IE obtuvo un 93.39 por ciento.