Plataforma integral para dar respuesta a los requerimientos de
la analítica 3.0. Cubre todas las capas de los sistemas
informacionales y al ser modular se adapta a cada caso
Map Reduce
ETL Tradicional
ERP CRM
SW de
3ºs
Data Warehouse
RDBMS
Nuevos
Canales
Nuevas
Fuentes
Logs,
text, IoT
HDFS
Analytics Platform
MPP y NoSQL
Core Info.
Reporting
Volumen
Coste
Procesamiento
Nuevas fuentes
Nueva analítica
Legacy
Supply
Chain
Map Reduce
ETL Tradicional
ERP CRM
SW de
3ºs
Data Warehouse
RDBMS
Nuevos
Canales
Nuevas
Fuentes
Logs,
text, IoT
HDFS
Core Info.
Reporting
Volumen
Coste
Procesamiento
Nuevas fuentes
Nueva analítica
Analytics Platform
MPP y NoSQL
COLLECT ELT STORE
Carga Batch
Encriptación
Comunicaciones
Hadoop
• Integración
• Transformación
• Data Cleaning
ODS (HDFS)
MONITORIZACIÓN ADMINISTRACIÓNGOVERNANCE
Data Warehouse
Capa NoSQL
Snapshot
Archivado
Servidor BI BI
APIs APPs
UX a medida
Salida-Integración
Servidor R Escritorio remoto
EXPLORE
Sin coste de infraestructura
Sin utilización de agregadores
• Seguridad
• SSL
• SSH
• VPC
• LOPD + encriptación
• Comunicaciones en función del volumen (100s de GB)
COLLECT Levantamiento del dato
Pago por uso
Procesamiento real-time
• Hadoop: Paralelización de procesos: EMR
• Persistencia de datos en crudo y posibilidad de archivado en Cloud
• Opción queries sobre datos en crudo (Hive-Impala)
• Opción ETL tradicional via ODBC (PowerCenter)
• Real Time ETL: Kinesis + Storm
• Encriptacion de datos en S3
ELT Procesamiento y persistencia de datos
Optimización ventana batch
• Filesystem distribuido (HDFS) + framework de programación (MapReduce)
• Paralelización automática de la ejecución en clústeres de servidores
• Aísla al programador de la definición de la paralelización; es tolerante a fallos
• Herramientas de alto nivel sobre MapReduce:
• Filesystem distribuido en S3: abstrae más aún de la configuración de infraestructura
• Los programas MapReduce se cargan y ejecutan en un servicio: Elastic MapReduce Amazon
EMR
Amazon
S3
Pseudo SQL
Sripting para
tratamiento de
datos
Hadoop como herramienta que facilita la ELT
Hadoop en AWS
Ingest CleanseTransform
Copia a
DWH
Amazon S3
Metadatos Archivado
Consultas
“raw” data
Amazon
EMR
Capa Batch - ODS
STORE Analytics Platform
• DWH alto Rendimiento-MPP
• Cluster de varias maquinas
• Consultas alta velocidad
• SQL standard (Postgre)
• Seguridad SSL y encriptacion
• Capa Velocidad
• Alta disponibilidad
• Alta concurrencia
• BBDD adaptada a requerimientos: Dynamo, Mongo DB, Neo4j
• Solución de Datalab o Discover
Solución modular
BBDD estándar con alto rendimiento
DynamoDB
Amazon
Redshift
(MPP)
NoSQL: “not only SQL”
Sin esquema prefijado (schema-
less); sin relación preestablecida
No existe un estándar en cuanto a
estructura o lenguaje de consultas
MPP: Procesamiento
masivo paralelo
Cluster de varios nodos, cada uno
con CPU y almacenamiento
Escalado horizontal: datos
distribuidos, queries distribuidas
Amazon
Redshift
EXPLORE Analítica, reporting y visualización
• Herramientas BI
• Integración total via ODBC: BO, Microstrategy, Tableau, Qlikview
• Analitica R en servidor de alta memoria mediante escritorio remoto
• Drill-down en tiempo real
• APIs: aplicaciones sobre datos de solución en storage
• Visualización avanzada a medida
• Multidispositivo: HTML5
• UX
Integración con herramientas comerciales
Variedad de soluciones de explotación: por área, tipo de dato, etc.
COLLECT ELT STORE EXPLORE
HTTPS vía SSL
Anonimización y
encriptación en origen
Login por SSH
VPN: firewall, subredes,
tunel IPsec, etc.
Configuración de reglas
de firewall integradas
Almacenamiento
cifrado AES 256
IAM: reglas para
perfilado y accesoa
Privilegios intraDB por
user, group, objeto
APIs vía SSL
Acceso RDP
protegido por reglas
Almacenamiento
cifrado AES 256
HERRAMIENTAS DE MONITORIZACIÓN Y GESTIÓN DE LA SEGURIDAD
Map Reduce
ETL Tradicional
ERP CRM
SW de
3ºs
Data Warehouse
RDBMS
Nuevos
Canales
Nuevas
Fuentes
Logs,
text, IoT
HDFS
Analytics Platform
MPP y NoSQL
Legacy
Supply
Chain
ENCUÉNTRANOS EN…
CALLE CLARA DEL REY, 26 28002 MADRID
902 20 25 52
hablemos@beeva.es
www.beeva.es
@beeva_es

Data Platform de BEEVA

  • 1.
    Plataforma integral paradar respuesta a los requerimientos de la analítica 3.0. Cubre todas las capas de los sistemas informacionales y al ser modular se adapta a cada caso
  • 7.
    Map Reduce ETL Tradicional ERPCRM SW de 3ºs Data Warehouse RDBMS Nuevos Canales Nuevas Fuentes Logs, text, IoT HDFS Analytics Platform MPP y NoSQL Core Info. Reporting Volumen Coste Procesamiento Nuevas fuentes Nueva analítica Legacy Supply Chain
  • 8.
    Map Reduce ETL Tradicional ERPCRM SW de 3ºs Data Warehouse RDBMS Nuevos Canales Nuevas Fuentes Logs, text, IoT HDFS Core Info. Reporting Volumen Coste Procesamiento Nuevas fuentes Nueva analítica Analytics Platform MPP y NoSQL
  • 9.
    COLLECT ELT STORE CargaBatch Encriptación Comunicaciones Hadoop • Integración • Transformación • Data Cleaning ODS (HDFS) MONITORIZACIÓN ADMINISTRACIÓNGOVERNANCE Data Warehouse Capa NoSQL Snapshot Archivado Servidor BI BI APIs APPs UX a medida Salida-Integración Servidor R Escritorio remoto EXPLORE
  • 10.
    Sin coste deinfraestructura Sin utilización de agregadores • Seguridad • SSL • SSH • VPC • LOPD + encriptación • Comunicaciones en función del volumen (100s de GB) COLLECT Levantamiento del dato
  • 11.
    Pago por uso Procesamientoreal-time • Hadoop: Paralelización de procesos: EMR • Persistencia de datos en crudo y posibilidad de archivado en Cloud • Opción queries sobre datos en crudo (Hive-Impala) • Opción ETL tradicional via ODBC (PowerCenter) • Real Time ETL: Kinesis + Storm • Encriptacion de datos en S3 ELT Procesamiento y persistencia de datos Optimización ventana batch
  • 12.
    • Filesystem distribuido(HDFS) + framework de programación (MapReduce) • Paralelización automática de la ejecución en clústeres de servidores • Aísla al programador de la definición de la paralelización; es tolerante a fallos • Herramientas de alto nivel sobre MapReduce: • Filesystem distribuido en S3: abstrae más aún de la configuración de infraestructura • Los programas MapReduce se cargan y ejecutan en un servicio: Elastic MapReduce Amazon EMR Amazon S3 Pseudo SQL Sripting para tratamiento de datos Hadoop como herramienta que facilita la ELT Hadoop en AWS
  • 13.
    Ingest CleanseTransform Copia a DWH AmazonS3 Metadatos Archivado Consultas “raw” data Amazon EMR Capa Batch - ODS
  • 14.
    STORE Analytics Platform •DWH alto Rendimiento-MPP • Cluster de varias maquinas • Consultas alta velocidad • SQL standard (Postgre) • Seguridad SSL y encriptacion • Capa Velocidad • Alta disponibilidad • Alta concurrencia • BBDD adaptada a requerimientos: Dynamo, Mongo DB, Neo4j • Solución de Datalab o Discover Solución modular BBDD estándar con alto rendimiento
  • 15.
    DynamoDB Amazon Redshift (MPP) NoSQL: “not onlySQL” Sin esquema prefijado (schema- less); sin relación preestablecida No existe un estándar en cuanto a estructura o lenguaje de consultas
  • 16.
    MPP: Procesamiento masivo paralelo Clusterde varios nodos, cada uno con CPU y almacenamiento Escalado horizontal: datos distribuidos, queries distribuidas Amazon Redshift
  • 17.
    EXPLORE Analítica, reportingy visualización • Herramientas BI • Integración total via ODBC: BO, Microstrategy, Tableau, Qlikview • Analitica R en servidor de alta memoria mediante escritorio remoto • Drill-down en tiempo real • APIs: aplicaciones sobre datos de solución en storage • Visualización avanzada a medida • Multidispositivo: HTML5 • UX Integración con herramientas comerciales Variedad de soluciones de explotación: por área, tipo de dato, etc.
  • 18.
    COLLECT ELT STOREEXPLORE HTTPS vía SSL Anonimización y encriptación en origen Login por SSH VPN: firewall, subredes, tunel IPsec, etc. Configuración de reglas de firewall integradas Almacenamiento cifrado AES 256 IAM: reglas para perfilado y accesoa Privilegios intraDB por user, group, objeto APIs vía SSL Acceso RDP protegido por reglas Almacenamiento cifrado AES 256 HERRAMIENTAS DE MONITORIZACIÓN Y GESTIÓN DE LA SEGURIDAD
  • 19.
    Map Reduce ETL Tradicional ERPCRM SW de 3ºs Data Warehouse RDBMS Nuevos Canales Nuevas Fuentes Logs, text, IoT HDFS Analytics Platform MPP y NoSQL Legacy Supply Chain
  • 20.
    ENCUÉNTRANOS EN… CALLE CLARADEL REY, 26 28002 MADRID 902 20 25 52 hablemos@beeva.es www.beeva.es @beeva_es