SlideShare una empresa de Scribd logo
1 de 22
Descargar para leer sin conexión
Introducción a las bases de
datos NoSQL.
Indice


 Introducción a las bases de datos NoSQL.

 Quiénes las están usando.

 Limitaciones.

 Comparación de diversas soluciones.

 Conclusiones.
Definición Bases de datos
                 NoSQL
NoSQL aglutina las diferentes soluciones de base de datos
centradas en ser no relacionales, distribuidas y escalables
de forma horizontal.

El concepto NoSQL es algo que ha venido tomando fuerza
durante los últimos años y se plantea al día de hoy como
una alternativa madura y eficiente que nos puede ayudar a
resolver los problemas de escalabilidad y rendimiento de
aplicaciones online con miles de usuarios concurrentes y
millones de consultas al día.
Importancia de las arquitecturas
                escalables
El escalamiento es la habilidad de un sistema de atender un
creciente numero de requerimientos sin degradar la calidad
del servicio.

El escalamiento vertical se logra aumentando la capacidad de
un equipo en: memoria, disco, procesadores, etc.
 El escalamiento horizontal se logra
 adicionando computadores (nodos) al
 “cluster” de computadores en el que se
 ejecuta el sistema.
Importancia de las arquitecturas
            escalables II
El escalamiento horizontal reduce el riesgo de un único
punto de fallo en un sistema de alta disponibilidad.

Por su relación costo / beneficio el escalamiento horizontal
es la apuesta de los servicios actuales de Internet: Redes
sociales, computación en la nube, etc

En su evolución estos servicios han encontrado que los
métodos de escalamiento horizontal de las bases de datos
relacionales no satisfacen sus necesidades de rendimiento.
Teorema CAP o de Brewer I
           (Consistency, Availability, Partition tolerance)
  onsistencia: Todos los nodos tienen los
 C
mismos datos.

  isponibilidad: Cada requerimiento hecho
 D
a un nodo que no este fallando debería
recibir respuesta.

  olerancia a particiones: El sistema sigue
 T
funcionando aun con Particiones físicas en
la red. ( Perdida de mensajes entre nodos )

 En un sistema distribuido solo es posible
 ofrecer simultáneamente dos de las tres
              características
Teorema CAP o de Brewer II
Teorema CAP o de Brewer III


                  “Consistencia eventual”

Las bases de datos NoSql que garantizan la disponibilidad de
los datos y tolerancia a fallos , sacrifican temporalmente la
                  consistencia de los datos.
Tipos de Base de datos NoSQL
  ases de datos para grafos.
 B

  ases de datos documentales.
 B

  ases de datos Orientados a columnas.
 B

  ases de datos clave-valor
 B
Bases de datos orientadas a
                grafos.
Fundamentados en la teoría de grafos. La información se
guarda en estructuras de nodos, arcos (conexiones) y
propiedades ( de arcos y nodos).

Están orientados a manejos de datos muy complejos y con
muchas relaciones. Problemas típicos que enfrentan:

  ncontrar la mejor ruta en un mapa.
 E

  ncontrar relaciones en una red social.
 E

  j: Neo4j, FlockDB.
 E
Bases de datos documentales

La información se almacena en objetos xml, json, etc

Renuncian a la estructura fija de datos usual en RDBMS.

Almacenan información semiestructurada.

Documentos con nueva estructura puede ser adicionados sin
afectar la estructura de los documentos ya existentes.

Ej: CouchDB, MongoDB
Bases de datos orientadas a
               columnas
El almacenamiento básico es la columna: Nombre, valor.

Una familia de columnas      es una clave seguida de un
numero variable de columnas.

Su equivalente relacional seria una tabla.

Cassandra y otras incluyen implícitamente el timestamp en
cada columna para manejar versiones de los datos.
Bases de datos clave-valor


Como su nombre lo indica la estructura básica del
almacenamiento es una “clave”, que permite recuperar un
“valor”, donde “valor” representa el objeto guardado.

Son almacenamientos distribuidos optimizados para el
escalamiento horizontal.

Ej; Voldemort
Introducción a NO SQL
                      Énfasis
               Clave-valor
                     Familias
                     de columnas
Escalamiento
                                     Documentales

                                                     Grafos




           Facilidad de acceso a los de datos y la complejidad de
           sus relaciones
Quienes las están usando?



             Google desarrolló Bigtable

            Facebook desarrolló Casandra

           Linkedin Desarrolló Voldemort

        Amazon desarrollo SimpleDb, Dynamo



Casandra y Voldemort son ahora proyectos Open source
Limitaciones



  Las base de datos NoSQL presentan limitaciones en la
             consulta y explotación de datos.



Siendo altamente especializadas cada base de datos NoSQL
 presenta peculiaridades en su API. Prácticamente no hay
estándares entre las diferentes familias de bases de datos
                          NO SQL.
Nuestra comparación
(Enfocado en funcionalidad y no rendimiento)

Memcached
  onfiguración: No requiere configuración. Con la ejecución
 C
de un programa un equipo se convierte en proveedor del
servicio (nodo). Implementación para Linux y una no oficial
para Windows.

  so: El API es muy sencillo.
 U

  omunidad: Entre sus clientes se incluyen Youtube y
 C
Wikipedia.

  valuación: Inclusión de nodos en caliente; varios nodos
 E
por equipo. No ofrece persistencia en disco.
Berkeley DB


  onfiguración: El fabricante provee el instalador tanto
 C
para Linux como para Windows y están bien documentados.

  omunidad: Es un producto comprado y mejorado por
 C
Oracle.

  valuación: Su API permite hacer consultas no solo por
  E
llave sino por campos del valor. No es distribuida.
Hbase

  onfiguración: Depende de otros productos como Hadoop y
 C
ZooKeeper, con su propia configuración. Se puede requerir
configuración a nivel del sistema operativo.

  so: El API requiere más codificación de lo usual en este
  U
tipo de productos y puede conducir a “method overhead”.

  ctividad de la comunidad: Como proyecto de Apache que
 A
es, cuenta con mucha audiencia.
Voldemort
 Configuración: 3 archivos de configuración por nodo.
 



 Conceptos: Particiones de llaves, políticas de enrutamiento
 

y factores de replicación. Los valores por defecto son
suficientes para empezar.

  so: Utilidad de línea de comandos para hacer put, get.
 U
Cuenta con un modulo de administración.

  omunidad: Foros activos, Consultas resueltas en cuestión
 C
de horas.

  valuación: Es Java. El concepto de regiones de caché
  E
tiene equivalente en el store.
Conclusiones
  as Bases de datos NoSQL son herramientas en permanente evolución.
 L

 Es recomendable definir una capa de acceso a datos que permite
aprovechar las ventajas de las bases de datos NoSQL sin generar
dependencia de un producto especifico.

  as bases de datos NoSQL son soluciones especializadas que atacan una
 L
problemática muy especifica (escalamiento, concurrencia y grandes
volúmenes de datos), no son un remplazo natural a las bases de datos
relacionales.

  l éxito de una arquitectura implementada sobre NoSQL depende en gran
 E
medida del diseño de las estructuras de datos y la forma como estos son
recuperados y procesados.

  as base de datos relacionales y las base de datos NoSQL son tecnologías
 L
que pueden coexistir dentro de un mismo desarrollo/aplicación aportando
valor y llegando a ser tecnologías complementarias.
Referencias
  Scalable Stores” de Rick cattell en http://www.cattell.net/datastores/
 “
index.html Incluye un estudio de las familias NoSQL, y links a recursos
actualizados sobre el tema.

 http://nosql-database.org/ Ofrece un catalogo de las diversas soluciones
NoSQL.

  ttp://www.royans.net/arch/brewers-cap-theorem-on-distributed-
 h
systems/ Describe el teorema CAP.

  ttp://blog.nahurst.com/visual-guide-to-nosql-systems Es la fuente del
 h
diagrama de clasificación de las soluciones NoSQl de acuerdo con el
Teorema CAP.

  ttp://www.alberton.info/
 h
nosql_databases_what_when_why_phpuk2011.html Es la fuente del
diagrama de Tamaño / complejidad e incluye descripciones de las diversas
arquitecturas y conceptos claves de NoSQL.

Más contenido relacionado

La actualidad más candente (20)

Principales bases de datos
Principales bases de datosPrincipales bases de datos
Principales bases de datos
 
Conceptos de NoSoloSQL
Conceptos de NoSoloSQLConceptos de NoSoloSQL
Conceptos de NoSoloSQL
 
Apache cassandra
Apache cassandraApache cassandra
Apache cassandra
 
BASE DE DATOS
BASE DE DATOSBASE DE DATOS
BASE DE DATOS
 
Actividad de aprendizaje 4. screencast y bases de datos.
Actividad de aprendizaje 4. screencast y bases de datos.Actividad de aprendizaje 4. screencast y bases de datos.
Actividad de aprendizaje 4. screencast y bases de datos.
 
Act4 base de_datos_guadalupe_monroy
Act4 base de_datos_guadalupe_monroyAct4 base de_datos_guadalupe_monroy
Act4 base de_datos_guadalupe_monroy
 
Bases de Datos No Relacionales
Bases de Datos No RelacionalesBases de Datos No Relacionales
Bases de Datos No Relacionales
 
BASE DE DATOS MICROSOFT SQL SERVER
BASE DE DATOS MICROSOFT SQL SERVERBASE DE DATOS MICROSOFT SQL SERVER
BASE DE DATOS MICROSOFT SQL SERVER
 
Bases datos
Bases datosBases datos
Bases datos
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Introduccion a Cassandra
Introduccion a CassandraIntroduccion a Cassandra
Introduccion a Cassandra
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Act4 samuel dominguez._basesdedatos
Act4 samuel dominguez._basesdedatosAct4 samuel dominguez._basesdedatos
Act4 samuel dominguez._basesdedatos
 
Base de datos
Base de datos Base de datos
Base de datos
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Base de datos sánchez erika
Base de datos sánchez erikaBase de datos sánchez erika
Base de datos sánchez erika
 
Sistemasgestoresdebasededatosrelacionales
SistemasgestoresdebasededatosrelacionalesSistemasgestoresdebasededatosrelacionales
Sistemasgestoresdebasededatosrelacionales
 
Base de datos
Base de datosBase de datos
Base de datos
 
Bases de datos svmm
Bases de datos svmmBases de datos svmm
Bases de datos svmm
 

Destacado

Un sábado en "La Colifata"
Un sábado en "La Colifata"Un sábado en "La Colifata"
Un sábado en "La Colifata"Juli Gil
 
Aprendizaje Colaborativo
Aprendizaje ColaborativoAprendizaje Colaborativo
Aprendizaje Colaborativoadrearosana
 
Preguntas pleno dia 10 enero 2012
Preguntas pleno dia 10 enero 2012Preguntas pleno dia 10 enero 2012
Preguntas pleno dia 10 enero 2012UPyD Parla
 
Edward revilla
Edward revillaEdward revilla
Edward revilladkedking
 
Diapositivas en equipo
Diapositivas en equipoDiapositivas en equipo
Diapositivas en equipoYarel Soto
 
politica educativa de farias cuvbe
politica educativa  de farias cuvbepolitica educativa  de farias cuvbe
politica educativa de farias cuvbesara_28
 
EWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDS
EWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDSEWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDS
EWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDSEWMA
 
Deber de desarrollo organizacional
Deber de desarrollo organizacionalDeber de desarrollo organizacional
Deber de desarrollo organizacionalpersonal
 
ALBUM DE DIBUJOS SOBRE PULPOTE
ALBUM DE DIBUJOS SOBRE PULPOTEALBUM DE DIBUJOS SOBRE PULPOTE
ALBUM DE DIBUJOS SOBRE PULPOTEpatripublicaciones
 
Ficha de seguimiento implementacion ava jaime
Ficha de seguimiento implementacion ava jaimeFicha de seguimiento implementacion ava jaime
Ficha de seguimiento implementacion ava jaimeJaimeleguizamon
 
Presentacion p205
Presentacion p205Presentacion p205
Presentacion p205lacabrer
 

Destacado (20)

Un sábado en "La Colifata"
Un sábado en "La Colifata"Un sábado en "La Colifata"
Un sábado en "La Colifata"
 
Aprendizaje Colaborativo
Aprendizaje ColaborativoAprendizaje Colaborativo
Aprendizaje Colaborativo
 
Netiquetas
NetiquetasNetiquetas
Netiquetas
 
Mmmmmmmmmm
MmmmmmmmmmMmmmmmmmmm
Mmmmmmmmmm
 
Metodos no parametricos ji cuadrado anexo
Metodos no parametricos ji cuadrado anexoMetodos no parametricos ji cuadrado anexo
Metodos no parametricos ji cuadrado anexo
 
Guachochi y la EST 9
Guachochi   y la EST 9Guachochi   y la EST 9
Guachochi y la EST 9
 
Preguntas pleno dia 10 enero 2012
Preguntas pleno dia 10 enero 2012Preguntas pleno dia 10 enero 2012
Preguntas pleno dia 10 enero 2012
 
Edward revilla
Edward revillaEdward revilla
Edward revilla
 
Diapositivas en equipo
Diapositivas en equipoDiapositivas en equipo
Diapositivas en equipo
 
Votado co..
Votado co..Votado co..
Votado co..
 
Actividad 4.6
Actividad 4.6Actividad 4.6
Actividad 4.6
 
politica educativa de farias cuvbe
politica educativa  de farias cuvbepolitica educativa  de farias cuvbe
politica educativa de farias cuvbe
 
Tipologia y topologia de redes
Tipologia y topologia de redesTipologia y topologia de redes
Tipologia y topologia de redes
 
EWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDS
EWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDSEWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDS
EWMA 2014 - EP403 PRODUCT USE IN THE SYSTEMATIC TREATMENT OF CHRONIC WOUNDS
 
Deber de desarrollo organizacional
Deber de desarrollo organizacionalDeber de desarrollo organizacional
Deber de desarrollo organizacional
 
ALBUM DE DIBUJOS SOBRE PULPOTE
ALBUM DE DIBUJOS SOBRE PULPOTEALBUM DE DIBUJOS SOBRE PULPOTE
ALBUM DE DIBUJOS SOBRE PULPOTE
 
Alauda en cusco
Alauda en cuscoAlauda en cusco
Alauda en cusco
 
Ficha de seguimiento implementacion ava jaime
Ficha de seguimiento implementacion ava jaimeFicha de seguimiento implementacion ava jaime
Ficha de seguimiento implementacion ava jaime
 
Proyecto realizacion
Proyecto realizacionProyecto realizacion
Proyecto realizacion
 
Presentacion p205
Presentacion p205Presentacion p205
Presentacion p205
 

Similar a NoSql introducción -Innova4j (20)

Act. 4 screencast y base de datos norma
Act. 4 screencast y base de datos normaAct. 4 screencast y base de datos norma
Act. 4 screencast y base de datos norma
 
Actividad de aprendizaje 4 screencast y bases de datos.jltc
Actividad de aprendizaje 4 screencast y bases de datos.jltcActividad de aprendizaje 4 screencast y bases de datos.jltc
Actividad de aprendizaje 4 screencast y bases de datos.jltc
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Sql o NoSql en Informática Médica
Sql o NoSql en Informática MédicaSql o NoSql en Informática Médica
Sql o NoSql en Informática Médica
 
Que una base de datos
Que una base de datosQue una base de datos
Que una base de datos
 
Act4 presentación jiménez_mireya
Act4 presentación jiménez_mireyaAct4 presentación jiménez_mireya
Act4 presentación jiménez_mireya
 
Act4 presentación jiménez_mireya
Act4 presentación jiménez_mireyaAct4 presentación jiménez_mireya
Act4 presentación jiménez_mireya
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Bases de Datos SQL y NoSQL
Bases de Datos SQL y NoSQLBases de Datos SQL y NoSQL
Bases de Datos SQL y NoSQL
 
Base de datos
Base de datosBase de datos
Base de datos
 
Principales Bsases de Datsos
Principales Bsases de DatsosPrincipales Bsases de Datsos
Principales Bsases de Datsos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Act4 andrade lesvia
Act4 andrade lesviaAct4 andrade lesvia
Act4 andrade lesvia
 
Base de Datos
Base de DatosBase de Datos
Base de Datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos 1.2
Base de datos 1.2Base de datos 1.2
Base de datos 1.2
 
BASE DE DATOS
BASE DE DATOSBASE DE DATOS
BASE DE DATOS
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 

Último

La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 

Último (16)

La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 

NoSql introducción -Innova4j

  • 1. Introducción a las bases de datos NoSQL.
  • 2. Indice  Introducción a las bases de datos NoSQL.  Quiénes las están usando.  Limitaciones.  Comparación de diversas soluciones.  Conclusiones.
  • 3. Definición Bases de datos NoSQL NoSQL aglutina las diferentes soluciones de base de datos centradas en ser no relacionales, distribuidas y escalables de forma horizontal. El concepto NoSQL es algo que ha venido tomando fuerza durante los últimos años y se plantea al día de hoy como una alternativa madura y eficiente que nos puede ayudar a resolver los problemas de escalabilidad y rendimiento de aplicaciones online con miles de usuarios concurrentes y millones de consultas al día.
  • 4. Importancia de las arquitecturas escalables El escalamiento es la habilidad de un sistema de atender un creciente numero de requerimientos sin degradar la calidad del servicio. El escalamiento vertical se logra aumentando la capacidad de un equipo en: memoria, disco, procesadores, etc. El escalamiento horizontal se logra adicionando computadores (nodos) al “cluster” de computadores en el que se ejecuta el sistema.
  • 5. Importancia de las arquitecturas escalables II El escalamiento horizontal reduce el riesgo de un único punto de fallo en un sistema de alta disponibilidad. Por su relación costo / beneficio el escalamiento horizontal es la apuesta de los servicios actuales de Internet: Redes sociales, computación en la nube, etc En su evolución estos servicios han encontrado que los métodos de escalamiento horizontal de las bases de datos relacionales no satisfacen sus necesidades de rendimiento.
  • 6. Teorema CAP o de Brewer I (Consistency, Availability, Partition tolerance)   onsistencia: Todos los nodos tienen los C mismos datos.   isponibilidad: Cada requerimiento hecho D a un nodo que no este fallando debería recibir respuesta.   olerancia a particiones: El sistema sigue T funcionando aun con Particiones físicas en la red. ( Perdida de mensajes entre nodos ) En un sistema distribuido solo es posible ofrecer simultáneamente dos de las tres características
  • 7. Teorema CAP o de Brewer II
  • 8. Teorema CAP o de Brewer III “Consistencia eventual” Las bases de datos NoSql que garantizan la disponibilidad de los datos y tolerancia a fallos , sacrifican temporalmente la consistencia de los datos.
  • 9. Tipos de Base de datos NoSQL   ases de datos para grafos. B   ases de datos documentales. B   ases de datos Orientados a columnas. B   ases de datos clave-valor B
  • 10. Bases de datos orientadas a grafos. Fundamentados en la teoría de grafos. La información se guarda en estructuras de nodos, arcos (conexiones) y propiedades ( de arcos y nodos). Están orientados a manejos de datos muy complejos y con muchas relaciones. Problemas típicos que enfrentan:   ncontrar la mejor ruta en un mapa. E   ncontrar relaciones en una red social. E   j: Neo4j, FlockDB. E
  • 11. Bases de datos documentales La información se almacena en objetos xml, json, etc Renuncian a la estructura fija de datos usual en RDBMS. Almacenan información semiestructurada. Documentos con nueva estructura puede ser adicionados sin afectar la estructura de los documentos ya existentes. Ej: CouchDB, MongoDB
  • 12. Bases de datos orientadas a columnas El almacenamiento básico es la columna: Nombre, valor. Una familia de columnas es una clave seguida de un numero variable de columnas. Su equivalente relacional seria una tabla. Cassandra y otras incluyen implícitamente el timestamp en cada columna para manejar versiones de los datos.
  • 13. Bases de datos clave-valor Como su nombre lo indica la estructura básica del almacenamiento es una “clave”, que permite recuperar un “valor”, donde “valor” representa el objeto guardado. Son almacenamientos distribuidos optimizados para el escalamiento horizontal. Ej; Voldemort
  • 14. Introducción a NO SQL Énfasis Clave-valor Familias de columnas Escalamiento Documentales Grafos Facilidad de acceso a los de datos y la complejidad de sus relaciones
  • 15. Quienes las están usando? Google desarrolló Bigtable Facebook desarrolló Casandra Linkedin Desarrolló Voldemort Amazon desarrollo SimpleDb, Dynamo Casandra y Voldemort son ahora proyectos Open source
  • 16. Limitaciones Las base de datos NoSQL presentan limitaciones en la consulta y explotación de datos. Siendo altamente especializadas cada base de datos NoSQL presenta peculiaridades en su API. Prácticamente no hay estándares entre las diferentes familias de bases de datos NO SQL.
  • 17. Nuestra comparación (Enfocado en funcionalidad y no rendimiento) Memcached   onfiguración: No requiere configuración. Con la ejecución C de un programa un equipo se convierte en proveedor del servicio (nodo). Implementación para Linux y una no oficial para Windows.   so: El API es muy sencillo. U   omunidad: Entre sus clientes se incluyen Youtube y C Wikipedia.   valuación: Inclusión de nodos en caliente; varios nodos E por equipo. No ofrece persistencia en disco.
  • 18. Berkeley DB   onfiguración: El fabricante provee el instalador tanto C para Linux como para Windows y están bien documentados.   omunidad: Es un producto comprado y mejorado por C Oracle.   valuación: Su API permite hacer consultas no solo por E llave sino por campos del valor. No es distribuida.
  • 19. Hbase   onfiguración: Depende de otros productos como Hadoop y C ZooKeeper, con su propia configuración. Se puede requerir configuración a nivel del sistema operativo.   so: El API requiere más codificación de lo usual en este U tipo de productos y puede conducir a “method overhead”.   ctividad de la comunidad: Como proyecto de Apache que A es, cuenta con mucha audiencia.
  • 20. Voldemort Configuración: 3 archivos de configuración por nodo.   Conceptos: Particiones de llaves, políticas de enrutamiento   y factores de replicación. Los valores por defecto son suficientes para empezar.   so: Utilidad de línea de comandos para hacer put, get. U Cuenta con un modulo de administración.   omunidad: Foros activos, Consultas resueltas en cuestión C de horas.   valuación: Es Java. El concepto de regiones de caché E tiene equivalente en el store.
  • 21. Conclusiones   as Bases de datos NoSQL son herramientas en permanente evolución. L  Es recomendable definir una capa de acceso a datos que permite aprovechar las ventajas de las bases de datos NoSQL sin generar dependencia de un producto especifico.   as bases de datos NoSQL son soluciones especializadas que atacan una L problemática muy especifica (escalamiento, concurrencia y grandes volúmenes de datos), no son un remplazo natural a las bases de datos relacionales.   l éxito de una arquitectura implementada sobre NoSQL depende en gran E medida del diseño de las estructuras de datos y la forma como estos son recuperados y procesados.   as base de datos relacionales y las base de datos NoSQL son tecnologías L que pueden coexistir dentro de un mismo desarrollo/aplicación aportando valor y llegando a ser tecnologías complementarias.
  • 22. Referencias   Scalable Stores” de Rick cattell en http://www.cattell.net/datastores/ “ index.html Incluye un estudio de las familias NoSQL, y links a recursos actualizados sobre el tema.  http://nosql-database.org/ Ofrece un catalogo de las diversas soluciones NoSQL.   ttp://www.royans.net/arch/brewers-cap-theorem-on-distributed- h systems/ Describe el teorema CAP.   ttp://blog.nahurst.com/visual-guide-to-nosql-systems Es la fuente del h diagrama de clasificación de las soluciones NoSQl de acuerdo con el Teorema CAP.   ttp://www.alberton.info/ h nosql_databases_what_when_why_phpuk2011.html Es la fuente del diagrama de Tamaño / complejidad e incluye descripciones de las diversas arquitecturas y conceptos claves de NoSQL.