Este documento describe Apache Cassandra, una base de datos NoSQL. Explica que las bases de datos NoSQL surgieron para enfrentar los desafíos de almacenar y procesar grandes cantidades de datos que las bases de datos relacionales no podían manejar. Cassandra utiliza un modelo clave-valor y organiza los datos en espacios de claves, familias de columnas y supercolumnas. También describe cómo instalar y utilizar Cassandra desde la línea de comandos.
2. Actualmente las bases de datos ya no se entienden como hace
una década: todo ha evolucionado con la llegada de Internet y
los motores de bases de datos no son la excepción.
BASES DE DATOS EXISTENTES:
Existen dos fuertes movimientos en el universo de las bases de
datos: uno es el movimiento “SQL” y otro el movimiento “NoSQL”,
ambos con sus pros y contras.
3. ACERCA DE APACHE CASSANDRA (NO SQL)
Las Bases de Datos NoSQL crecieron con las principales compañías de Internet,
como Google, Amazon, Twitter y Facebook. Éstas tenían que enfrentarse a
desafíos con el tratamiento de datos que las tradicionales RDBMS no
solucionaban .
4. Modelo de Almacenamiento Clave –
Valor En un sistema RDBMS tenemos bases de datos y dentro de cada base de
datos tenemos tablas formadas por filas y columnas. En cambio en un sistema
clave-valor tenemos contenedores, también se les llama cabinets, en cada
contenedor podemos tener tantas parejas de clave-valor como queramos. En
cada contenedor podemos tener datos de la misma naturaleza o totalmente
diferente. A cada clave se asocia un valor (clave=valor), por ejemplo:
“Nombre=Jose”, “Apellido=Hernandez”.
5. MODELADO SUPERCOLUMN:
es un elemento compuesto por varias columnas y sus nombres:•
Ejemplo visual de super columna:Supercolumna(“Nombre de la
supercolumna” -> xxx(“columna1”-> xxx(“nombre”-> xxx“valor”-
>xxx“timestamp”->xxx)“columna2”-> xxx(“nombre”-> xxx“valor”-
>xxx“timestamp”->xxxx)))
6. MODELADO COLUMFAMILY:
Es un contenedor de columnas que se asemeja al concepto de
tabla de las bases de datos relacionales. El contenido es una lista
ordenada de columnas. Cada columfamily se guarda en un
fichero ordenado por clave de fila. El contenido de una columfamil
y consta de un conjunto de filas con un conjunto de columnas
similar pero no idéntico.
7. MODELADO KEYSPACE:
Un espacio de claves o KeySpace es un esquema de alto nivel
que contiene familias de columnas, y se asemeja a una base de
datos en lo que respecta al modelo relacional.
8. DIFRENCIAS DE ESTA BASE DE DATOS.
- Una distinción de las más importantes es que en Cassandra no existe la Integridad
referencial que existe en el modelo relacional, no hay joins, pero estos se pueden emular
almacenando las claves de una Columfamily en otras filas de otro columFamily o
haciendo uso de índices
- Otra diferencia entre Cassandra y el Modelo de datos relacional es que Casandra no
normaliza los datos a la hora de genera el modelo, ya que trabaja con un mayor
rendimiento con datos des-normalizados, por ello a la hora de modelar la base de datos
de Cassandra se debe pensar primero en las consultas que se van a realizar y una vez se
sepan que consultas van a hacerse a las bases de datos se realiza el modelo de datos
para satisfacer a dichas consultas, al contrario que pasa con el modelo relacional en el
que primero se piensa que datos van a ser los que se van a almacenar para luego
modelarlos de manera normalizada.
9.
10. COMO INSTALAR CASSANDRA
Al saber que las instrucciones están en ingles pues, sencillamente
se debe da clik en “siguiente”, para continuar con la instalación.
11.
12. Para la utilización de CASSANDRA se debe instalar también “JDK”
13. PARA QUE EL MODO CONSOLA DE cassandra funcione es necesario copiar estos
archivos EN LA CARPETA DE UBICACION, de ese modo el modo consola resultara fácil
de usar y si errores.
14. EJEMPLO MODO DE USO DE LA CONSOLA DE CASSANDRA.
CON EL DOCIGO créate keyspace y USE RESPECTIVAMENTE
Luego para crear una tabla se usa el código CREATE TABLE y los valores respectivos.
15. Luego para poder ingresar datos a la tabla ates creada se usa el comando
USE para verla y el comando INSERT INTO para ingresar.
16. Por ultimo para desplegar los datos ingresados en la tabla se usa el
comando SELECT *FROM y el nombre de la tabla creada.
17. Creado por : Joel Pogo
COLEGIO DON BOSCO LA TOLA
GRACIAS