SlideShare una empresa de Scribd logo
1 de 46
Bases de Datos Analíticas-ColumnaresBases de Datos Analíticas-Columnares
Índice
o Características
o Monet DB
o Arquitectura
o Almacenamiento
o Distinciones
o Cluster
o HP Vertica
o Proyecciones
o Hybrid Data Store
o Optimizaciones
o Cluster
o Límites
Características
Características
Organiza los
datos en
columnas
Características
Organiza los
datos en
columnas
Características
Organiza los
datos en
columnas
Características
Organiza los
datos en
columnas
Características
Organiza los
datos en
columnas
Características
Organiza los
datos en
columnas
Características
Organiza los
datos en
columnas
Monet DBMonet DB
Monet DB - Arquitectura
o Se enfoca más en la disponibilidad que en la
consistencia
o Muy Flexible a personalizaciones por parte del
usuario
Monet DB - Almacenamiento
o Binary Association Table (BAT)
o Datos para consultar por XQuery
o XML
o JSON
o Binario
o Capacidad de leer de un Stream de datos
o Se configura la fuente de datos, indicando la dirección en formato [protocolo]://
[servidor]:[puerto]
oid name
0000
0
monet
OID tipo
00000 db
OID year
11111 2000
OID plus
11111 15
Monet DB - Distinciones
o Rendimiento óptimo cuando el mayor volumen en el
manejo de datos puede hacerse en la memoria principal
o Debido a la eficiente generada por la técnica llamada
“Cache Locality”
o Se basa en la localización de los bloques de memoria de forma secuencial
para optimizar el acceso a ellos
Monet DB - Distinciones
o Radix-Cluster for Join, una innovación en algoritmos de
joins en Bases de Datos.
o Este algoritmos logra una Complejidad Computacional de
las consultas insuperable O(max (n,m)), mientras que en
otros sistemas como PostresSQL, MySQL o SQL Server que
toman O (n + m).
Monet DB - Distinciones
o Aprovecha las ventajas de la paralelización usando Map-
Reduce y Replicación.
o Amplio rango de alcance, sobre todo en temas académicos,
incluyendo librerías externas
o libxml
o geos
o raptor (software para predicción de la estructura de proteínas)
o Varios formatos pueden ser incluidos como formato de
vaults (cargas masivas).
Monet DB - Distinciones
o Monet Interpreted Language
o Puede ser extendido con nuevas funciones de evaluación
por parte de los usuarios
Monet DB – Cluster – Instalación
o Instalar MonetDB individualmente en cada nodo (monetdbd)
o monetdbd create /path/to/store/server
o Asignar propiedades a la BD para formar el Cluster (monetdb)
o monetdb –h [server] –P [password] create test_db
o monetdb set shared=/home/db/1 test_db
o monetdb –h [server] –P [password] start test_db
o Usar el cliente para las consultas (mclient)
o mclient –d “/home/db/1”
Monet DB - Cluster – Balanceo de Datos
o Balanceo de carga en Monet DB se logra usando un patrón para
conectarse al cluster.
o Este patrón deberá incluir todas las BD sobre las que se quiera
operar en la conexión
o mclient –d “/home/db/*”
o mclient usa un Round Robin en las peticiones, es decir,
selecciona el siguiente nodo en cada comando enviado al
servidor.
Monet DB - Cluster – Replicación
o Multiplex Funnel, especifica una conexión multiplexada a los
nodos del cluster que se especifiquen.
o monetdb create -m
[user]+password@[db_or_tag_name],
[user]+password@[db_or_tag_name]
[multiplex_funnel_name]
o Usado como técnica de replicación
o Recomendado para sentencias de lectura de datos solamente.
HP VerticaHP Vertica
HP Vertica - Proyecciones
o Una tabla puede tener varias proyecciones,
cada una ordenada por un atributo diferente
o Cada proyección tiene una copia de los datos
o Este concepto optimiza las consultas sobre un
atributo ordenado
HP Vertica - Hybrid Data Store
o Write Optimized Store (WOS)
o Una estructura de datos almacenada en memoria para operaciones de inserción y
actualizado
o Los datos aquí están sin comprimir ni ordenar para lograr eficiencia en el proceso
o Read Optimized Store (ROS)
o Contiene los datos estables de la Base de Datos
o Los datos están comprimidos y ordenados
HP Vertica - Hybrid Data Store
o Tuple Mover
o Mueve los datos desde el WOS hacia el ROS
o Opera en secciones completas del WOS, realiza las operaciones de inserción usando
operaciones batch
o Storage Container
o En cada nodo hay varios Storage Container por proyección, haciendo el papel de
versiones
o Es el equivalente al Tuple Mover a nivel de Nodo. Una vez que el Tuple Mover a
insertado los datos hacia un nodo, este componente se encarga de actualizar los
antiguos datos con los nuevos
HP Vertica - Hybrid Data Store (Análisis)
o Este mecanismo es ideal para Bases de Datos
analíticas, porque se enfoca en las consultas
eficientes, el control de concurrencia y la
inserción/actualización en grandes volúmenes
o Para aplicaciones que requieran una sincronización
estricta entre la inserción y la lectura de datos, el
Hybrid Data Store no es ideal
HP Vertica - Optimizaciones
o Vertica no necesita descomprimir los datos de una
columna para realizar operaciones de agregación
o Las proyecciones pueden tener columnas de una
relación de llave primaria – llave foránea, estas
proyecciones son llamadas pre-join projections
o Pre-join projections, ofrecen una gran ventaja en
cuanto a rendimiento en operaciones de INNER JOIN
HP Vertica - Optimizaciones
o k-safety para garantizar la integridad de datos antes
fallos de nodos, se basa en tener k copias de los
datos
o Cada réplica está ordenada por un atributo
diferente, lo cual optimiza el tiempo de las consultas
o Usa las ‘Buddy Projections’ : proyecciones que se
diferencian solo en el atributo por el cual están
ordenados los datos.
o Uso en replicación y particionamiento
HP Vertica - Clúster - Introducción
o Clúster a nivel de servidor: es la disponibilidad de
nodos físicos a los que pueden expandirse las BD.
o Se pueden definir todos los nodos durante la instalación
o Incremento de nodos sin necesidad de reinstalar
o Clúster a nivel de BD: De los nodos físicos disponible,
podemos elegir en cuáles se distribuirá cada BD
o Se puede definir durante la creación de la BD
o Incrementar nodos después de creada, con balanceo
automático.
HP Vertica - Clúster - Replicación
o La Replicación es la posibilidad de tener múltiples
copias de cada proyección distribuidas por el clúster.
o Si más de la mitad de los nodos de un clúster no
están disponibles, Vertica automáticamente se
apaga.
o En HP Vertica hay 3 posibles valores de K (0,1,2)
HP Vertica - Clúster - Replicación
o Ejemplo K = 1
o Nodos críticos
K-level Nodes
0 1+
1 3+
2 5+
K 2K+1
HP Vertica - Clúster - Replicación
o Ejemplo creación de tabla con K-safety
CREATE TABLE location(..., state VARCHAR NOT
NULL, ...) KSAFE [2]
o Ejemplo creación de proyección con K-safety
CREATE PROJECTION projection-name AS SELECT …
FROM table [ KSAFE [ 1 ] ]
HP Vertica – Clúster - Replicación
o Monitorizar K-safety
o SELECT current_fault_tolerance FROM system;
o SELECT * FROM v_monitor.critical_nodes;
HP Vertica - Clúster - Segmentación
o La segmentación permite que cada proyección pueda
distribuir sus datos por los nodos del clúster basado
en un atributo.
o La segmentación por hash debe cumplir con los
siguientes requisitos:
o Datos suficientemente únicos a lo largo de la columna
o Distribución aceptablemente aleatoria o asimétrica en cada
elemento nuevo insertado
HP Vertica – Clúster - Segmentación
o Tipos de Segmentación
o Modular Hash Segmentation es una forma de segmentación
recomendable para atributos con un patrón regular, i.e los tipos de
datos secuenciales
o Simple Hash Segmentation es la forma de segmentación
recomendada para atributos con un patrón irregular, como los UUID
de Java
HP Vertica - Clúster - Segmentación
o Ejemplo de tabla con segmentación
CREATE TABLE tw_search (..., tw_account_name VARCHAR
NOT NULL, ...)
SEGMENTED BY HASH(tw_Created_YearMonth) ALL NODES
OFFSET 0;
o El parámetro offset significa el nodo a partir del cual se quiere
segmentar
HP Vertica – Clúster - Segmentación
o Ejemplo de proyección con segmentación
CREATE PROJECTION tweetsAnioMes (tw_Text,
tw_Created_YearMonth) AS
(select tw_Text, tw_Created_YearMonth FROM tw_search
ORDER BY 2)
SEGMENTED BY HASH(tw_Created_YearMonth) ALL NODES
OFFSET 2;
o El parámetro offset significa el nodo a partir del cual se quiere
segmentar
HP Vertica - Clúster - Balanceo de Carga
o IPVS (Internet Protocol Virtual Server). Es una
característica del kernel de linux que permite que un
host pueda hacer de Gateway, para eso usa IP
virtuales e instala paquetes de software adicionales.
o Native Conection Load Balancing. Es una
característica implementada en el servidor de HP
Vertica y las librerías cliente. Se basa en la asignación
de conexiones a los clientes por parte del servidor.
HP Vertica - Clúster - Balanceo de Carga - Nativa
o Opciones de Native Conection Load Balancing
o NONE. Deshabilitado por defecto.
o ROUNDROBIN. Selecciona el siguiente nodo del anillo de nodos
en cada conexión.
o RANDOM. Selecciona aleatoriamente un nodo.
o SELECT SET_LOAD_BALANCE_POLICY('ROUNDROBIN');
o SELECT LOAD_BALANCE_POLICY FROM V_CATALOG.DATABASES;
o SELECT NODE_NAME FROM V_MONITOR.CURRENT_SESSION;
HP Vertica - Clúster - Balanceo de Carga - Nativa
o Es necesario poner un parámetro en la conexión para
que las peticiones sean de tipo load balance.
o ConnectionLoadBalance = 1
o Si usamos como cliente el SQuirrel, se configura
fácilmente mediante la interfaz.
HP Vertica - Clúster – Balanceo de Carga - IPVS
o Dos nodos directores (generalmente tienen datos)
o Master Director, se encarga del enrutamiento de las peticiones
o Slave Director, se comunica con el Master Director y asume su rol
en caso de fallo
o N nodos de datos (128 máximo recomendado)
o IP privadas para la conexión entre nodos
o IP reales de cara a los clientes del clúster
HP Vertica - Clúster – Balanceo de carga - Análisis
o Nativa
o Sencilla de Instalar
o Eficiente
o Mayores Requisitos de Conectividad con los clientes
o IPVS
o Compleja de Instalar
o Consumidora de Recursos
o Menores requisitos de conectividad con los clientes
HP Vertica - Límites
o Capacidad de la BD: (Máximo Tamaño de Fichero * Nodos *
Discos Duros)
o Número de filas por tabla: 2^64 filas en cada Nodo
o Capacidad de una fila: 32,768,000 bytes
o Número de nodos: 128 (Recomendable)
o Conexiones concurrentes por nodo: 50 por defecto, limitado
por la plataforma (típicamente 1024)
Sobre nosotros - Stratebi
Confían en Business Intelligence Open Source
Sector Privado
Sector Público
Stratebi: Quiénes somos
www.TodoBI.com
info@stratebi.com
www.stratebi.com
Mas información
Tfno: 91.788.34.10
Madrid: Pº de la Castellana, 164, 1º
Barcelona: C/ Valencia, 63
Brasil: Av. Paulista, 37 4 andar
Preguntas

Más contenido relacionado

La actualidad más candente

Control interno de pasivos ctas por pagar
Control interno de pasivos ctas por pagarControl interno de pasivos ctas por pagar
Control interno de pasivos ctas por pagarV G
 
Costo Estandar Ideal y Esperados
Costo Estandar  Ideal y EsperadosCosto Estandar  Ideal y Esperados
Costo Estandar Ideal y EsperadosKaterine Tamayo
 
Nia 620 700-706
Nia 620 700-706Nia 620 700-706
Nia 620 700-706karol1125
 
Seminario 10. correlación bivariada
Seminario 10. correlación bivariadaSeminario 10. correlación bivariada
Seminario 10. correlación bivariadaencsangar
 
Nia 520 procedimientos analíticos (resumen)
Nia 520  procedimientos analíticos (resumen)Nia 520  procedimientos analíticos (resumen)
Nia 520 procedimientos analíticos (resumen)Edmund8
 
Asociación de costos y gastos con ingresos
Asociación de costos y gastos con ingresosAsociación de costos y gastos con ingresos
Asociación de costos y gastos con ingresosARTEMISA12
 
Dictamen opinión del auditor
Dictamen opinión del auditorDictamen opinión del auditor
Dictamen opinión del auditor600582
 
Auditoria de producto organizadores graficos
Auditoria de producto organizadores graficosAuditoria de producto organizadores graficos
Auditoria de producto organizadores graficosVivi Coba
 
Trabajo auditoria al patrimonio nias
Trabajo auditoria al patrimonio niasTrabajo auditoria al patrimonio nias
Trabajo auditoria al patrimonio niasRocio Mendoza Tineo
 
Nía 610 utilización del trabajo de los
Nía 610 utilización del trabajo de losNía 610 utilización del trabajo de los
Nía 610 utilización del trabajo de losFrancisco Magaña
 
Metodología De la investigación de operaciones
Metodología De la investigación de operacionesMetodología De la investigación de operaciones
Metodología De la investigación de operacionesXSilvana XMonasteriosx
 
Presentacion Trabajo del Auditor (1).pptx
Presentacion Trabajo del Auditor (1).pptxPresentacion Trabajo del Auditor (1).pptx
Presentacion Trabajo del Auditor (1).pptxTERESAMARTINEZ431398
 
Auditoría de inversiones proyecto (1) (1)
Auditoría de inversiones proyecto (1) (1)Auditoría de inversiones proyecto (1) (1)
Auditoría de inversiones proyecto (1) (1)cecyupa
 
101476711 departamentalizacion-de-costos
101476711 departamentalizacion-de-costos101476711 departamentalizacion-de-costos
101476711 departamentalizacion-de-costosDigitex
 

La actualidad más candente (20)

Control interno de pasivos ctas por pagar
Control interno de pasivos ctas por pagarControl interno de pasivos ctas por pagar
Control interno de pasivos ctas por pagar
 
Costo Estandar Ideal y Esperados
Costo Estandar  Ideal y EsperadosCosto Estandar  Ideal y Esperados
Costo Estandar Ideal y Esperados
 
Nia 620 700-706
Nia 620 700-706Nia 620 700-706
Nia 620 700-706
 
Seminario 10. correlación bivariada
Seminario 10. correlación bivariadaSeminario 10. correlación bivariada
Seminario 10. correlación bivariada
 
Nia 520 procedimientos analíticos (resumen)
Nia 520  procedimientos analíticos (resumen)Nia 520  procedimientos analíticos (resumen)
Nia 520 procedimientos analíticos (resumen)
 
Asociación de costos y gastos con ingresos
Asociación de costos y gastos con ingresosAsociación de costos y gastos con ingresos
Asociación de costos y gastos con ingresos
 
Dictamen opinión del auditor
Dictamen opinión del auditorDictamen opinión del auditor
Dictamen opinión del auditor
 
Auditoria de producto organizadores graficos
Auditoria de producto organizadores graficosAuditoria de producto organizadores graficos
Auditoria de producto organizadores graficos
 
Trabajo auditoria al patrimonio nias
Trabajo auditoria al patrimonio niasTrabajo auditoria al patrimonio nias
Trabajo auditoria al patrimonio nias
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 
Nía 610 utilización del trabajo de los
Nía 610 utilización del trabajo de losNía 610 utilización del trabajo de los
Nía 610 utilización del trabajo de los
 
Metodología De la investigación de operaciones
Metodología De la investigación de operacionesMetodología De la investigación de operaciones
Metodología De la investigación de operaciones
 
Presentacion Trabajo del Auditor (1).pptx
Presentacion Trabajo del Auditor (1).pptxPresentacion Trabajo del Auditor (1).pptx
Presentacion Trabajo del Auditor (1).pptx
 
Auditoria Financiera...
Auditoria Financiera...Auditoria Financiera...
Auditoria Financiera...
 
Normas de auditoria
Normas de auditoriaNormas de auditoria
Normas de auditoria
 
Resumen analisis vertical y horizontal
Resumen analisis vertical y horizontalResumen analisis vertical y horizontal
Resumen analisis vertical y horizontal
 
Estado financiero-2014-2015
Estado financiero-2014-2015Estado financiero-2014-2015
Estado financiero-2014-2015
 
Auditoría de inversiones proyecto (1) (1)
Auditoría de inversiones proyecto (1) (1)Auditoría de inversiones proyecto (1) (1)
Auditoría de inversiones proyecto (1) (1)
 
101476711 departamentalizacion-de-costos
101476711 departamentalizacion-de-costos101476711 departamentalizacion-de-costos
101476711 departamentalizacion-de-costos
 
Costo estandar (3)
Costo estandar (3)Costo estandar (3)
Costo estandar (3)
 

Destacado

53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning53 Claves para conocer Machine Learning
53 Claves para conocer Machine LearningStratebi
 
69 claves para conocer Big Data
69 claves para conocer Big Data69 claves para conocer Big Data
69 claves para conocer Big DataStratebi
 
Referencias Stratebi
Referencias StratebiReferencias Stratebi
Referencias StratebiStratebi
 
Introduccion a Machine Learning
Introduccion a Machine LearningIntroduccion a Machine Learning
Introduccion a Machine LearningStratebi
 
Stratebi Big Data
Stratebi Big DataStratebi Big Data
Stratebi Big DataStratebi
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningStratebi
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para DummiesStratebi
 
Open space Scrum - Agilidad en Proyectos
Open space Scrum - Agilidad en ProyectosOpen space Scrum - Agilidad en Proyectos
Open space Scrum - Agilidad en ProyectosStratebi
 
How to install Vertica in a single node.
How to install Vertica in a single node.How to install Vertica in a single node.
How to install Vertica in a single node.Anil Maharjan
 
Introduccion a Git
Introduccion a GitIntroduccion a Git
Introduccion a GitStratebi
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes socialesDatKnoSys
 
Introduccion a Cassandra
Introduccion a CassandraIntroduccion a Cassandra
Introduccion a CassandraStratebi
 
Introduccion a Machine Learning
Introduccion a Machine LearningIntroduccion a Machine Learning
Introduccion a Machine LearningStratebi
 
Ejemplos de Cuadros de Mando Open Source
Ejemplos de Cuadros de Mando Open SourceEjemplos de Cuadros de Mando Open Source
Ejemplos de Cuadros de Mando Open SourceStratebi
 
Curso de big data
Curso de big data Curso de big data
Curso de big data Luis Joyanes
 
Tutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtimeTutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtimeSocialmetrix
 
Arquitectura y Funcionalidades Liferay Portal
Arquitectura y Funcionalidades Liferay PortalArquitectura y Funcionalidades Liferay Portal
Arquitectura y Funcionalidades Liferay PortalStratebi
 
Comparativa herramientas Business Intelligence
Comparativa herramientas Business IntelligenceComparativa herramientas Business Intelligence
Comparativa herramientas Business IntelligenceStratebi
 
Curso de creación de Dashboards Open Source
Curso de creación de Dashboards Open SourceCurso de creación de Dashboards Open Source
Curso de creación de Dashboards Open SourceStratebi
 

Destacado (20)

53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning
 
69 claves para conocer Big Data
69 claves para conocer Big Data69 claves para conocer Big Data
69 claves para conocer Big Data
 
Referencias Stratebi
Referencias StratebiReferencias Stratebi
Referencias Stratebi
 
Introduccion a Machine Learning
Introduccion a Machine LearningIntroduccion a Machine Learning
Introduccion a Machine Learning
 
Stratebi Big Data
Stratebi Big DataStratebi Big Data
Stratebi Big Data
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine Learning
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Open space Scrum - Agilidad en Proyectos
Open space Scrum - Agilidad en ProyectosOpen space Scrum - Agilidad en Proyectos
Open space Scrum - Agilidad en Proyectos
 
How to install Vertica in a single node.
How to install Vertica in a single node.How to install Vertica in a single node.
How to install Vertica in a single node.
 
Alfresco
AlfrescoAlfresco
Alfresco
 
Introduccion a Git
Introduccion a GitIntroduccion a Git
Introduccion a Git
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Introduccion a Cassandra
Introduccion a CassandraIntroduccion a Cassandra
Introduccion a Cassandra
 
Introduccion a Machine Learning
Introduccion a Machine LearningIntroduccion a Machine Learning
Introduccion a Machine Learning
 
Ejemplos de Cuadros de Mando Open Source
Ejemplos de Cuadros de Mando Open SourceEjemplos de Cuadros de Mando Open Source
Ejemplos de Cuadros de Mando Open Source
 
Curso de big data
Curso de big data Curso de big data
Curso de big data
 
Tutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtimeTutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtime
 
Arquitectura y Funcionalidades Liferay Portal
Arquitectura y Funcionalidades Liferay PortalArquitectura y Funcionalidades Liferay Portal
Arquitectura y Funcionalidades Liferay Portal
 
Comparativa herramientas Business Intelligence
Comparativa herramientas Business IntelligenceComparativa herramientas Business Intelligence
Comparativa herramientas Business Intelligence
 
Curso de creación de Dashboards Open Source
Curso de creación de Dashboards Open SourceCurso de creación de Dashboards Open Source
Curso de creación de Dashboards Open Source
 

Similar a Bases de Datos Analiticas-Columnares

Oracle Coherence (by Leonardo Torres Altez)
Oracle Coherence (by Leonardo Torres Altez)Oracle Coherence (by Leonardo Torres Altez)
Oracle Coherence (by Leonardo Torres Altez)barcelonajug
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseJoseph Lopez
 
Charla técnica comercial v3.0 junio 2014 db visit productos
Charla técnica comercial v3.0 junio 2014 db visit productosCharla técnica comercial v3.0 junio 2014 db visit productos
Charla técnica comercial v3.0 junio 2014 db visit productosRonald Francisco Vargas Quesada
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryRaul Martin Sarachaga Diaz
 
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...SpanishPASSVC
 
Azure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_anguloAzure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_anguloAdrian Miranda
 
Cloud Computing: las nuevas Capas de Persistencia
Cloud Computing: las nuevas Capas de PersistenciaCloud Computing: las nuevas Capas de Persistencia
Cloud Computing: las nuevas Capas de PersistenciaDavid J. Brenes
 
Arquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptxArquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptxkareliamedina1
 

Similar a Bases de Datos Analiticas-Columnares (20)

Base de dato
Base de  dato Base de  dato
Base de dato
 
Base de dato act4
Base de  dato act4Base de  dato act4
Base de dato act4
 
Oracle Coherence (by Leonardo Torres Altez)
Oracle Coherence (by Leonardo Torres Altez)Oracle Coherence (by Leonardo Torres Altez)
Oracle Coherence (by Leonardo Torres Altez)
 
Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS
 
Explorando los Sabores de Azure DW
Explorando los Sabores de Azure DWExplorando los Sabores de Azure DW
Explorando los Sabores de Azure DW
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
DBMoto7 full_es
DBMoto7 full_esDBMoto7 full_es
DBMoto7 full_es
 
Charla técnica comercial v3.0 junio 2014 db visit productos
Charla técnica comercial v3.0 junio 2014 db visit productosCharla técnica comercial v3.0 junio 2014 db visit productos
Charla técnica comercial v3.0 junio 2014 db visit productos
 
Capitulo 9_branch cache
Capitulo 9_branch cacheCapitulo 9_branch cache
Capitulo 9_branch cache
 
sesion 01_sql basico.pdf
sesion 01_sql basico.pdfsesion 01_sql basico.pdf
sesion 01_sql basico.pdf
 
ADO.NET
ADO.NETADO.NET
ADO.NET
 
Azure DataFactory
Azure DataFactoryAzure DataFactory
Azure DataFactory
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data Factory
 
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...
 
Azure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_anguloAzure SQL Data Warehouse desde cada_angulo
Azure SQL Data Warehouse desde cada_angulo
 
Bases de datos distribuidas
Bases de datos distribuidasBases de datos distribuidas
Bases de datos distribuidas
 
Explorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data FactoryExplorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data Factory
 
SEVILLA Meetups23032023.pdf
SEVILLA Meetups23032023.pdfSEVILLA Meetups23032023.pdf
SEVILLA Meetups23032023.pdf
 
Cloud Computing: las nuevas Capas de Persistencia
Cloud Computing: las nuevas Capas de PersistenciaCloud Computing: las nuevas Capas de Persistencia
Cloud Computing: las nuevas Capas de Persistencia
 
Arquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptxArquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptx
 

Más de Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 

Más de Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 

Último

max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxMarioKing10
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfjosellaqtas
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANASanyahelmont
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfJC Díaz Herrera
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILAsofiagomez288291
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfJC Díaz Herrera
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfJC Díaz Herrera
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024IrapuatoCmovamos
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxlm8322074
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...JC Díaz Herrera
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfLizRamirez182254
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointaria66611782972
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxmariabeatrizbermudez
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxfatimacamilainjantem
 

Último (20)

max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 

Bases de Datos Analiticas-Columnares

  • 1. Bases de Datos Analíticas-ColumnaresBases de Datos Analíticas-Columnares
  • 2. Índice o Características o Monet DB o Arquitectura o Almacenamiento o Distinciones o Cluster o HP Vertica o Proyecciones o Hybrid Data Store o Optimizaciones o Cluster o Límites
  • 12. Monet DB - Arquitectura o Se enfoca más en la disponibilidad que en la consistencia o Muy Flexible a personalizaciones por parte del usuario
  • 13. Monet DB - Almacenamiento o Binary Association Table (BAT) o Datos para consultar por XQuery o XML o JSON o Binario o Capacidad de leer de un Stream de datos o Se configura la fuente de datos, indicando la dirección en formato [protocolo]:// [servidor]:[puerto] oid name 0000 0 monet OID tipo 00000 db OID year 11111 2000 OID plus 11111 15
  • 14. Monet DB - Distinciones o Rendimiento óptimo cuando el mayor volumen en el manejo de datos puede hacerse en la memoria principal o Debido a la eficiente generada por la técnica llamada “Cache Locality” o Se basa en la localización de los bloques de memoria de forma secuencial para optimizar el acceso a ellos
  • 15. Monet DB - Distinciones o Radix-Cluster for Join, una innovación en algoritmos de joins en Bases de Datos. o Este algoritmos logra una Complejidad Computacional de las consultas insuperable O(max (n,m)), mientras que en otros sistemas como PostresSQL, MySQL o SQL Server que toman O (n + m).
  • 16. Monet DB - Distinciones o Aprovecha las ventajas de la paralelización usando Map- Reduce y Replicación. o Amplio rango de alcance, sobre todo en temas académicos, incluyendo librerías externas o libxml o geos o raptor (software para predicción de la estructura de proteínas) o Varios formatos pueden ser incluidos como formato de vaults (cargas masivas).
  • 17. Monet DB - Distinciones o Monet Interpreted Language o Puede ser extendido con nuevas funciones de evaluación por parte de los usuarios
  • 18. Monet DB – Cluster – Instalación o Instalar MonetDB individualmente en cada nodo (monetdbd) o monetdbd create /path/to/store/server o Asignar propiedades a la BD para formar el Cluster (monetdb) o monetdb –h [server] –P [password] create test_db o monetdb set shared=/home/db/1 test_db o monetdb –h [server] –P [password] start test_db o Usar el cliente para las consultas (mclient) o mclient –d “/home/db/1”
  • 19. Monet DB - Cluster – Balanceo de Datos o Balanceo de carga en Monet DB se logra usando un patrón para conectarse al cluster. o Este patrón deberá incluir todas las BD sobre las que se quiera operar en la conexión o mclient –d “/home/db/*” o mclient usa un Round Robin en las peticiones, es decir, selecciona el siguiente nodo en cada comando enviado al servidor.
  • 20. Monet DB - Cluster – Replicación o Multiplex Funnel, especifica una conexión multiplexada a los nodos del cluster que se especifiquen. o monetdb create -m [user]+password@[db_or_tag_name], [user]+password@[db_or_tag_name] [multiplex_funnel_name] o Usado como técnica de replicación o Recomendado para sentencias de lectura de datos solamente.
  • 22. HP Vertica - Proyecciones o Una tabla puede tener varias proyecciones, cada una ordenada por un atributo diferente o Cada proyección tiene una copia de los datos o Este concepto optimiza las consultas sobre un atributo ordenado
  • 23. HP Vertica - Hybrid Data Store o Write Optimized Store (WOS) o Una estructura de datos almacenada en memoria para operaciones de inserción y actualizado o Los datos aquí están sin comprimir ni ordenar para lograr eficiencia en el proceso o Read Optimized Store (ROS) o Contiene los datos estables de la Base de Datos o Los datos están comprimidos y ordenados
  • 24. HP Vertica - Hybrid Data Store o Tuple Mover o Mueve los datos desde el WOS hacia el ROS o Opera en secciones completas del WOS, realiza las operaciones de inserción usando operaciones batch o Storage Container o En cada nodo hay varios Storage Container por proyección, haciendo el papel de versiones o Es el equivalente al Tuple Mover a nivel de Nodo. Una vez que el Tuple Mover a insertado los datos hacia un nodo, este componente se encarga de actualizar los antiguos datos con los nuevos
  • 25. HP Vertica - Hybrid Data Store (Análisis) o Este mecanismo es ideal para Bases de Datos analíticas, porque se enfoca en las consultas eficientes, el control de concurrencia y la inserción/actualización en grandes volúmenes o Para aplicaciones que requieran una sincronización estricta entre la inserción y la lectura de datos, el Hybrid Data Store no es ideal
  • 26. HP Vertica - Optimizaciones o Vertica no necesita descomprimir los datos de una columna para realizar operaciones de agregación o Las proyecciones pueden tener columnas de una relación de llave primaria – llave foránea, estas proyecciones son llamadas pre-join projections o Pre-join projections, ofrecen una gran ventaja en cuanto a rendimiento en operaciones de INNER JOIN
  • 27. HP Vertica - Optimizaciones o k-safety para garantizar la integridad de datos antes fallos de nodos, se basa en tener k copias de los datos o Cada réplica está ordenada por un atributo diferente, lo cual optimiza el tiempo de las consultas o Usa las ‘Buddy Projections’ : proyecciones que se diferencian solo en el atributo por el cual están ordenados los datos. o Uso en replicación y particionamiento
  • 28. HP Vertica - Clúster - Introducción o Clúster a nivel de servidor: es la disponibilidad de nodos físicos a los que pueden expandirse las BD. o Se pueden definir todos los nodos durante la instalación o Incremento de nodos sin necesidad de reinstalar o Clúster a nivel de BD: De los nodos físicos disponible, podemos elegir en cuáles se distribuirá cada BD o Se puede definir durante la creación de la BD o Incrementar nodos después de creada, con balanceo automático.
  • 29. HP Vertica - Clúster - Replicación o La Replicación es la posibilidad de tener múltiples copias de cada proyección distribuidas por el clúster. o Si más de la mitad de los nodos de un clúster no están disponibles, Vertica automáticamente se apaga. o En HP Vertica hay 3 posibles valores de K (0,1,2)
  • 30. HP Vertica - Clúster - Replicación o Ejemplo K = 1 o Nodos críticos K-level Nodes 0 1+ 1 3+ 2 5+ K 2K+1
  • 31. HP Vertica - Clúster - Replicación o Ejemplo creación de tabla con K-safety CREATE TABLE location(..., state VARCHAR NOT NULL, ...) KSAFE [2] o Ejemplo creación de proyección con K-safety CREATE PROJECTION projection-name AS SELECT … FROM table [ KSAFE [ 1 ] ]
  • 32. HP Vertica – Clúster - Replicación o Monitorizar K-safety o SELECT current_fault_tolerance FROM system; o SELECT * FROM v_monitor.critical_nodes;
  • 33. HP Vertica - Clúster - Segmentación o La segmentación permite que cada proyección pueda distribuir sus datos por los nodos del clúster basado en un atributo. o La segmentación por hash debe cumplir con los siguientes requisitos: o Datos suficientemente únicos a lo largo de la columna o Distribución aceptablemente aleatoria o asimétrica en cada elemento nuevo insertado
  • 34. HP Vertica – Clúster - Segmentación o Tipos de Segmentación o Modular Hash Segmentation es una forma de segmentación recomendable para atributos con un patrón regular, i.e los tipos de datos secuenciales o Simple Hash Segmentation es la forma de segmentación recomendada para atributos con un patrón irregular, como los UUID de Java
  • 35. HP Vertica - Clúster - Segmentación o Ejemplo de tabla con segmentación CREATE TABLE tw_search (..., tw_account_name VARCHAR NOT NULL, ...) SEGMENTED BY HASH(tw_Created_YearMonth) ALL NODES OFFSET 0; o El parámetro offset significa el nodo a partir del cual se quiere segmentar
  • 36. HP Vertica – Clúster - Segmentación o Ejemplo de proyección con segmentación CREATE PROJECTION tweetsAnioMes (tw_Text, tw_Created_YearMonth) AS (select tw_Text, tw_Created_YearMonth FROM tw_search ORDER BY 2) SEGMENTED BY HASH(tw_Created_YearMonth) ALL NODES OFFSET 2; o El parámetro offset significa el nodo a partir del cual se quiere segmentar
  • 37. HP Vertica - Clúster - Balanceo de Carga o IPVS (Internet Protocol Virtual Server). Es una característica del kernel de linux que permite que un host pueda hacer de Gateway, para eso usa IP virtuales e instala paquetes de software adicionales. o Native Conection Load Balancing. Es una característica implementada en el servidor de HP Vertica y las librerías cliente. Se basa en la asignación de conexiones a los clientes por parte del servidor.
  • 38. HP Vertica - Clúster - Balanceo de Carga - Nativa o Opciones de Native Conection Load Balancing o NONE. Deshabilitado por defecto. o ROUNDROBIN. Selecciona el siguiente nodo del anillo de nodos en cada conexión. o RANDOM. Selecciona aleatoriamente un nodo. o SELECT SET_LOAD_BALANCE_POLICY('ROUNDROBIN'); o SELECT LOAD_BALANCE_POLICY FROM V_CATALOG.DATABASES; o SELECT NODE_NAME FROM V_MONITOR.CURRENT_SESSION;
  • 39. HP Vertica - Clúster - Balanceo de Carga - Nativa o Es necesario poner un parámetro en la conexión para que las peticiones sean de tipo load balance. o ConnectionLoadBalance = 1 o Si usamos como cliente el SQuirrel, se configura fácilmente mediante la interfaz.
  • 40. HP Vertica - Clúster – Balanceo de Carga - IPVS o Dos nodos directores (generalmente tienen datos) o Master Director, se encarga del enrutamiento de las peticiones o Slave Director, se comunica con el Master Director y asume su rol en caso de fallo o N nodos de datos (128 máximo recomendado) o IP privadas para la conexión entre nodos o IP reales de cara a los clientes del clúster
  • 41. HP Vertica - Clúster – Balanceo de carga - Análisis o Nativa o Sencilla de Instalar o Eficiente o Mayores Requisitos de Conectividad con los clientes o IPVS o Compleja de Instalar o Consumidora de Recursos o Menores requisitos de conectividad con los clientes
  • 42. HP Vertica - Límites o Capacidad de la BD: (Máximo Tamaño de Fichero * Nodos * Discos Duros) o Número de filas por tabla: 2^64 filas en cada Nodo o Capacidad de una fila: 32,768,000 bytes o Número de nodos: 128 (Recomendable) o Conexiones concurrentes por nodo: 50 por defecto, limitado por la plataforma (típicamente 1024)
  • 43. Sobre nosotros - Stratebi
  • 44. Confían en Business Intelligence Open Source Sector Privado Sector Público
  • 45. Stratebi: Quiénes somos www.TodoBI.com info@stratebi.com www.stratebi.com Mas información Tfno: 91.788.34.10 Madrid: Pº de la Castellana, 164, 1º Barcelona: C/ Valencia, 63 Brasil: Av. Paulista, 37 4 andar