Euro (Euro Apache)

Apache Avro es un formato de almacenamiento de contenedor de objetos orientado a filas para Hadoop, así como un marco de serialización de datos y llamadas a procedimientos remotos. Hadoop es un marco de programación gratuito basado en Java que admite el procesamiento de grandes conjuntos de datos en un entorno informático distribuido. Avro está optimizado para operaciones de escritura e incluye un formato de cable para la comunicación entre nodos.

Avro realiza la traducción entre diferentes nodos mediante la definición de datos y los datos permanentes serializados. Avro utiliza la notación de objetos JavaScript para definir los tipos de datos y los protocolos. Los datos se transmiten en un formato binario compacto y eficiente. Un archivo contenedor de Avro consta de un encabezado y uno o varios bloques de almacenamiento de archivos.

El encabezado está compuesto por:

  • 4 bytes de ASCI "OBJ1"
  • Metadatos de archivo, incluida la definición del esquema
  • Un marcador de sincronización: 16 bytes de código generado aleatoriamente

Avro también incluye su propio lenguaje descriptor de interfaz (IDL) también llamado Avro, además de JSON para definir tipos de datos y protocolos. IDL facilita la adopción por parte de usuarios que están acostumbrados a IDL tradicionales más comunes, que tienen una sintaxis más parecida a C / C ++.

Avro es un proyecto de alto nivel patrocinado por Apache Software Foundation (ASF).