Cassandra (Apache Cassandra)

Apache Cassandra es un sistema de base de datos distribuida de código abierto que está diseñado para almacenar y administrar grandes cantidades de datos en servidores básicos. Cassandra puede servir como almacén de datos operativos en tiempo real para aplicaciones transaccionales en línea y como base de datos de lectura intensiva para sistemas de inteligencia empresarial (BI) a gran escala.

Creada originalmente para Facebook, Cassandra está diseñada para tener nodos simétricos de igual a igual, en lugar de nodos maestros o con nombre, para garantizar que nunca pueda haber un solo punto de falla (SPoF). Cassandra divide automáticamente los datos en todos los nodos del clúster de la base de datos, pero el administrador tiene el poder de determinar qué datos se replicarán y cuántas copias de los datos se crearán.

Después de que Facebook abriera el código, Cassandra se convirtió en un proyecto de Apache Incubator en 2008 y en un proyecto de Apache de alto nivel en 2010. Al momento de escribir este artículo, las implementaciones de Cassandra incluyen Netflix, Digg, Adobe, Twitter, HP, IBM, Rackspace, Cisco y Reddit.

El nombre Cassandra se inspiró en la hermosa vidente mística de la mitología griega cuyas predicciones para el futuro nunca fueron creídas.

Este tutorial de DataStax proporciona una excelente descripción general de Cassandra: