Ingestión de datos

La ingestión de datos es el proceso de obtener e importar datos para su uso inmediato o almacenamiento en una base de datos. Ingerir algo es "tomar algo o absorber algo". 

Los datos se pueden transmitir en tiempo real o ingerirse en lotes. Cuando los datos se ingieren en tiempo real, cada elemento de datos se importa tal como lo emite la fuente. Cuando los datos se ingieren en lotes, los elementos de datos se importan en fragmentos discretos a intervalos de tiempo periódicos. Un proceso de ingestión de datos eficaz comienza priorizando las fuentes de datos, validando archivos individuales y enrutando elementos de datos al destino correcto.

Cuando existen numerosas fuentes de big data en diversos formatos (las fuentes a menudo pueden llegar a cientos y los formatos a docenas), puede ser un desafío para las empresas ingerir datos a una velocidad razonable y procesarlos de manera eficiente para mantener una ventaja competitiva. . Con ese fin, los proveedores ofrecen programas de software que se adaptan a entornos informáticos o aplicaciones de software específicos. Cuando la ingestión de datos está automatizada, el software utilizado para llevar a cabo el proceso también puede incluir funciones de preparación de datos para estructurar y organizar los datos para que puedan ser analizados sobre la marcha o en un momento posterior mediante inteligencia empresarial (BI) y análisis empresarial (BA). programas.