2. ¿Qué es Cassandra?
Apache Cassandra es una base de datos NoSQL distribuida y basada
en un modelo de almacenamiento de «clave-valor», escrita en Java.
Permite grandes volúmenes de datos en forma distribuida. Por
ejemplo, lo usa Twitter para su plataforma. Su objetivo principal es la
escalabilidad lineal y la disponibilidad. La arquitectura distribuida de
Cassandra está basada en una serie de nodos iguales que se
comunican con un protocolo P2P con lo que la redundancia es
máxima.
¿Qué es NoSQL?
Una base de datos NoSQL proporciona un mecanismo para el
almacenamiento y recuperación de datos que emplea modelos de
consistencia menos limitadas que las bases de datos relacionales
tradicionales.
3. ¿Quiénes usan cassandra?
Facebook, twitter, etc.
Desarrollo
Entre las caracteristicas de Cassandra destacan.
- NoSql
- Modelo Clave – Valor
- Distribuida
- Escalabilidad Lineal
- Disponibilidad
- Rendimiento
- Tolerancia a Fallos
4. Instalación y Configuración
Primero que nada vallamos al portal donde se descarga
cassandra:
Una vez descargado el programa:
tenemos un archivo .tar el cual descomprimimos y movemos a
C: ó D:, renombramos la carpeta a “cassandra” para mayor
comodidad
5. Ahora editamos las variable de entorno del sistema y
agregamos una nueva variable del sistema cuyo nombre sea
“CASSANDRA_HOME” y su valor sea “C:cassandra”
6. Modifica el archivo C:cassandraconfcassandra.yaml
Reemplaza:
Código: [Seleccionar]
# commit log
commitlog_directory: /var/lib/cassandra/commitlog
por:
Código: [Seleccionar]
# commit log
commitlog_directory: C:/cassandra/commitlog
Citar
Nosotros hemos creado el directorio commitlog en C:/cassandra/
y también hay que reemplazar en elmismo archivo:
Código: [Seleccionar]
data_file_directories:
- /var/lib/cassandra/data
Por:
Código: [Seleccionar]
data_file_directories:
- C:/cassandra/data
Citar
Una vez mas nosotros hemos creado el directorio data en C:/cassandra/
7. Ahora vamos a el directorio C:cassandrabin y ejecutamos el
archivo cassandra.bat
Si todo fue bien veremos que el servidor de apache cassandra
esta a la espera de clientes Thrift.
8. ¿Qué es Thrift?
Es un framework para el desarrollo de servicios escalables entre
los distintos lenguajes de programacion.
¿Cómo funciona?
Primero que nada abrimos otra ventana de ms-dos y nos vamos
a la carpeta bin dentro de cassandra y ejecutamos ahora el
siguiente bat:
9. *Código: [Seleccionar]
*cassandra-cli.bat
Les deberá de aparecer algo como esto:
Código: [Seleccionar]
C:cassandrabin>cassandra-cli.bat
Starting Cassandra Client
Connected to: "Test Cluster" on 127.0.0.1/9160
Welcome to Cassandra CLI version 2.0.1
Please consider using the more convenient cqlsh instead of CLI
CQL3 is fully backwards compatible with Thrift data; see
http://www.datastax.com
/dev/blog/thrift-to-cql3
Type 'help;' or '?' for help.
Type 'quit;' or 'exit;' to quit.
[default@unknown]
10. ¿Qué es Keyspace?
En un almacén de datos NoSQL es un objeto que mantiene
unidos a todas las familias de columna de un diseño. Es la más
exterior agrupación de los datos en el almacén de datos.
Una Keyspace puede contener familias columna o super
columnas. Cada columna súper contiene uno o más familiares
columna, familia en al menos una columna de cada columna.