tipos de organización y sus objetivos y aplicación
Data Platform de BEEVA
1. Plataforma integral para dar respuesta a los requerimientos de
la analítica 3.0. Cubre todas las capas de los sistemas
informacionales y al ser modular se adapta a cada caso
2.
3.
4.
5.
6.
7. Map Reduce
ETL Tradicional
ERP CRM
SW de
3ºs
Data Warehouse
RDBMS
Nuevos
Canales
Nuevas
Fuentes
Logs,
text, IoT
HDFS
Analytics Platform
MPP y NoSQL
Core Info.
Reporting
Volumen
Coste
Procesamiento
Nuevas fuentes
Nueva analítica
Legacy
Supply
Chain
8. Map Reduce
ETL Tradicional
ERP CRM
SW de
3ºs
Data Warehouse
RDBMS
Nuevos
Canales
Nuevas
Fuentes
Logs,
text, IoT
HDFS
Core Info.
Reporting
Volumen
Coste
Procesamiento
Nuevas fuentes
Nueva analítica
Analytics Platform
MPP y NoSQL
9. COLLECT ELT STORE
Carga Batch
Encriptación
Comunicaciones
Hadoop
• Integración
• Transformación
• Data Cleaning
ODS (HDFS)
MONITORIZACIÓN ADMINISTRACIÓNGOVERNANCE
Data Warehouse
Capa NoSQL
Snapshot
Archivado
Servidor BI BI
APIs APPs
UX a medida
Salida-Integración
Servidor R Escritorio remoto
EXPLORE
10. Sin coste de infraestructura
Sin utilización de agregadores
• Seguridad
• SSL
• SSH
• VPC
• LOPD + encriptación
• Comunicaciones en función del volumen (100s de GB)
COLLECT Levantamiento del dato
11. Pago por uso
Procesamiento real-time
• Hadoop: Paralelización de procesos: EMR
• Persistencia de datos en crudo y posibilidad de archivado en Cloud
• Opción queries sobre datos en crudo (Hive-Impala)
• Opción ETL tradicional via ODBC (PowerCenter)
• Real Time ETL: Kinesis + Storm
• Encriptacion de datos en S3
ELT Procesamiento y persistencia de datos
Optimización ventana batch
12. • Filesystem distribuido (HDFS) + framework de programación (MapReduce)
• Paralelización automática de la ejecución en clústeres de servidores
• Aísla al programador de la definición de la paralelización; es tolerante a fallos
• Herramientas de alto nivel sobre MapReduce:
• Filesystem distribuido en S3: abstrae más aún de la configuración de infraestructura
• Los programas MapReduce se cargan y ejecutan en un servicio: Elastic MapReduce Amazon
EMR
Amazon
S3
Pseudo SQL
Sripting para
tratamiento de
datos
Hadoop como herramienta que facilita la ELT
Hadoop en AWS
14. STORE Analytics Platform
• DWH alto Rendimiento-MPP
• Cluster de varias maquinas
• Consultas alta velocidad
• SQL standard (Postgre)
• Seguridad SSL y encriptacion
• Capa Velocidad
• Alta disponibilidad
• Alta concurrencia
• BBDD adaptada a requerimientos: Dynamo, Mongo DB, Neo4j
• Solución de Datalab o Discover
Solución modular
BBDD estándar con alto rendimiento
16. MPP: Procesamiento
masivo paralelo
Cluster de varios nodos, cada uno
con CPU y almacenamiento
Escalado horizontal: datos
distribuidos, queries distribuidas
Amazon
Redshift
17. EXPLORE Analítica, reporting y visualización
• Herramientas BI
• Integración total via ODBC: BO, Microstrategy, Tableau, Qlikview
• Analitica R en servidor de alta memoria mediante escritorio remoto
• Drill-down en tiempo real
• APIs: aplicaciones sobre datos de solución en storage
• Visualización avanzada a medida
• Multidispositivo: HTML5
• UX
Integración con herramientas comerciales
Variedad de soluciones de explotación: por área, tipo de dato, etc.
18. COLLECT ELT STORE EXPLORE
HTTPS vía SSL
Anonimización y
encriptación en origen
Login por SSH
VPN: firewall, subredes,
tunel IPsec, etc.
Configuración de reglas
de firewall integradas
Almacenamiento
cifrado AES 256
IAM: reglas para
perfilado y accesoa
Privilegios intraDB por
user, group, objeto
APIs vía SSL
Acceso RDP
protegido por reglas
Almacenamiento
cifrado AES 256
HERRAMIENTAS DE MONITORIZACIÓN Y GESTIÓN DE LA SEGURIDAD
19. Map Reduce
ETL Tradicional
ERP CRM
SW de
3ºs
Data Warehouse
RDBMS
Nuevos
Canales
Nuevas
Fuentes
Logs,
text, IoT
HDFS
Analytics Platform
MPP y NoSQL
Legacy
Supply
Chain