SlideShare una empresa de Scribd logo
Big Data en el Entorno
Bancario
Martín Cabrera
Technology Director
Everis, an NTT DATA Company
@dmcabrera
martin.cabrera.aguilar@everis.com
Enteprise Data
Warehouse
Cubos
Sistemas
Transaccionales
(OLTP)
Integración y
Consolidación
Operaciones y
Analítica
Arquitectura de Datos Tradicional
CRM
ERP
Web
Channel
Call
Center
ETL
Datamart
Datamart
ETL
Reportes Operativos y
Analíticos
CRM
ERP
Modelamiento y
minería de datos
ETL
Auditoría
Gaps de la Arquitectura de Datos Tradicional
• Soporte de volúmenes de datos limitado a
nivel de los sistemas OLTP
• Integración y consolidación compleja a
través de procesos ETL
• Excesiva normalización y rigidez a nivel de
los esquemas de datos
• No es compatible con la carga de fuentes de
datos no estructuradas
• No soporta naturalmente la implementación
de real-time analytics
• Capacidad de escalamiento y elasticidad
limitados y de alto costo
• Pensada principalmente para el mundo on-
premise, lo que dificulta su extensión hacia
el Cloud
30%
50%
20%
Workloads
ETL
Operaciones
Analíticos
No esta preparada para la
Transformación Digital
Arquitectura de Datos Moderna
Hadoop Distributed File System (HDFS)
Otro
EDW
DM
DM
Data Access APIs
OLTP OLTP OLTP
Workload Interactivo Workload Real-time Workload Batch Workload Analítico
Fuentes de Datos No Estructuradas
Documentos y
Correos
Web Logs &
Click Streams
Social
Networks
Cloud-based
Services
Sensors Data
Geo-location
Data
¿Cómo resuelve los gaps la Arquitectura de Datos Moderna?
• Eliminando la separación conceptual y física de
los datos OLTP y los datos Analíticos a partir de
una Arquitectura de Datos unificada
• Eliminando las clásicas limitaciones de manejo
de volúmenes de información restringidos
• Soportando bajo una misma plataforma todos
los workloads requeridos actualmente,
Interactivo, Real-time, Batch y Analítico
• Integrándose con los activos de datos existentes
como el EDW, los DataMarts y las bases de
datos OLTP más las fuentes de datos no
estructuradas.
• Generando la figura de un Enterprise Data Lake
disponible para toda la corporación.
• Siendo compatible con arquitecturas de tipo
Cloud-Híbrida
20%
40%
40%
Workloads
ETL
Operaciones
Analíticos
Siendo un habilitador
fundamental para la
implementación de
productos y servicios
digitales
Resumen Comparativo
• Volúmenes de datos limitados y
capacidad de escalamiento vertical.
• Separación conceptual y física de datos
OLTP y datos analíticos
rellenorellenorellen.o
• Excesiva normalización y rigidez a nivel de
los esquemas de datos.
• Limitaciones importantes para resolver
workloads de Real-time analytics
rellenorellenorelleno
• No preparada para soportar el desarrollo
de productos y servicios digitales
• Pensada principalmente para el mundo
on-premise.
Arquitectura de Datos Tradicional
• Volúmenes de datos ilimitados con
capacidad de escalamiento horizontal.
• Arquitectura de datos Unificada que
integra fuentes de datos estructuradas y
no estructuradas.
• Esquemas flexibles diseñados para
cambiar frecuentemente.
• Diseñada para soportar cualquier tipo de
workload, Interactivo, Real-time, Batch y
Analítico.
• Fundamental para la implementación de
productos y servicios digitales
• Compatible con cualquier arquitectura
Cloud (privada, pública, híbrida).
Arquitectura de Datos Moderna
Web/Móvil
Sucursales
Callcente
r
ETL
Enteprise Data
Warehouse
Inteligencia
de Clientes
Modelos
Predictivos
Campañas Push
Modelos Riesgo
Reportes
Pérdida de Información
al momento de
transformar los datos
Existen datos que no
estamos procesando (ej:
logs)
No soporta la
implementación de
servicios de Real-Time
Analytics
Capacidad Analítica
limitada a los datos
disponibles
Baja capacidad de
impulsar la práctica
de Data Discovery
Escenario actual en la Banca
Riesgo
Canales
Operacione
s
Carga incremental (en near-real-
time) de todas las fuentes de
información relevantes.
Carga de fuentes no estructuradas
como logs, correos e información de
redes sociales.
Escenario futuro (Big Data)
Real-time
Analytics API
Campañas
Real-time
Data Insight
Discovery
Logs
Logs
Logs
Big Data
Enterprise Platform
(Data Lake)
EL
ETL
Web/Móvil
Sucursales
Callcente
r
ETL
Enteprise Data
Warehouse
Modelos
Predictivos
Campañas Push
Modelos Riesgo
Reportes
Data
Scientists
Capacidad analítica potenciada por
nuevas fuentes de información
Soporta la implementación de
servicios real-time y la práctica de
Discovery de datos
Machine Learning
based models
Inteligenci
a de
Clientes
Riesgo
Canales
Operacione
s
¿Cuáles serían los casos de uso
más comunes de Big Data en la
Banca y la arquitectura sugerida?
Enterprise Data Warehouse offloading
Enterprise Data
Warehouse
OLTP
ETL
1
2
Movemos información de
menor valor y/o histórica
desde el EDW a Hadoop
ocupando Sqoop
También podemos
replicar la información en
Hadoop para derivar
carga de explotación
Equipos
Explotació
n
3
4
Los equipos explotan la
información con las
mismas herramientas
que ocupan
actualmente.
Enterprise Data Lake
Enterprise Data
Warehouse
(EDW)
ETL
1
Equipos
Explotació
n
3
4
OLTP
OLTP
Las bases de datos
OLTP más
importantes se
cargan as-is en
Hadoop en
modalidad Batch
ETL
2
El EDW puede ser
cargado desde el
Data Lake en
Hadoop a través de
procesos ETL
Enterprise Data Lake + Nuevas Fuentes
Enterprise Data
Warehouse
(EDW)
ETL
1
Equipos
Explotación
4
5
OLTP
El Data Lake
incorpora fuentes
de datos No
Estructuradas en
modalidad Batch
ETL
3
Logs
OLTP
Logs
2
Data
Scientists
Data Insight
Discovery
(Aster Data)
Advanced
Analytics
(Mahout, R)
Cognitive
Analytics
(IBM Watson)
Near-Real-Time Data Ingestion
Enterprise Data
Warehouse (EDW)
Equipos
Explotació
n
4
5
OLTP
Los agentes de Flume
hacen streaming de la
información generada
ETL
3
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
Los Interceptors de Flume
permiten enriquecer la
ingesta de datos para
finalmente guardarla en
HDFS (Hadoop)
1
2
Data
Scientists
Data Insight
Discovery
(Aster Data)
Advanced
Analytics
(Mahout, R)
Cognitive
Analytics
(IBM Watson)
Real-Time Analytics con HBase
OLTP
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
En el proceso de ingesta de
datos, se guarda
información en HBase que
posteriormente servirá
como input para los
servicios Real-Time (ej: el
consumo acumulado diario
por rubro de un cliente con
tarjeta de crédito).
1
Real-Time
Analytics
Services API
2
3 El servicio real-time (expuesto como
API) es consumido por ejemplo por
la aplicación móvil cada vez que el
cliente realiza un pago con tarjeta.
Con la estructura clave-valor en
HBase, el servicio puede advertir al
cliente de un consumo excesivo en
su tarjeta e inclusive compararlo con
meses y años anteriores.
Real-Time Analytics con HBase+Spark
OLTP
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
1
Real-Time
Analytics
Services API
3
Spark permite crear un
Resilient Distributed Dataset
(RDD) a partir de datos en
HDFS, HBase, etc.
Su capacidad de representar
los datos en memoria y de
procesar los mismos de
manera distribuida, permite
crear servicios de real-time
analytics avanzados que
requieran procesar grandes
volúmenes de datos.
2
Ejemplo Digital Journey soportado por BigData
Web
Red Social
El usuario se
conecta a
www.banco.cl
La aplicación le
indica que se
registre con sus
credenciales de
Twitter /
Facebook o
Linkedin
El usuario selecciona
Linkedin y la
aplicación solicita
permisos para
acceder a su perfil y
su lista de contactos
La aplicación le
muestra sus datos, le
solicita que ingrese su
número de móvil, una
clave segura y le envía
por SMS un código de
enrolamiento para su
dispositivo.
Móvil
El usuario recibe el
código de
enrolamiento para
confirmar su regsitro
El usuario confirma su registro y ya es
“Cliente Registrado”. La aplicación le da
la Bienvenida y la indica que 36 de sus
contactos en Linkedin ya son clientes
del Banco y que 22 de ellos tienen Cta
Cte y Tarjeta de Crédito, mientras que
18 tienen productos de inversión,
invitándolo a contratar dichos
productos
Email
El cliente recibe un correo de
bienvenida, con la misma
información de sus contactos que
está viendo en la aplicación web y
con la invitación a seguir
explorando los productos del
Banco
Resumiendo
• Los Bancos (y todos los negocios digitales) necesitan una
Arquitectura de Datos Moderna que soporte el
procesamiento de grandes volúmenes de información
(Big Data).
• El foco inicial debe estar puesto en la implementación de
una Plataforma de Big Data Corporativa, tanto para fines
analíticos como operativos.
• Los casos de uso más implementados son:
• Database offloading
• Enterprise Data Lake
• Near-Real-Time Data Ingestion
• Real-Time Analytics
Big Data en el Entorno
Bancario
Martín Cabrera
Technology Director
Everis, an NTT DATA Company
@dmcabrera
martin.cabrera.aguilar@everis.com

Más contenido relacionado

La actualidad más candente

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Data warehouse
Data warehouseData warehouse
Data warehouse
Marian C.
 
Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
Cristian Salazar C.
 
Diagrama de Flujo de Datos (DFD)
Diagrama de Flujo de Datos (DFD)Diagrama de Flujo de Datos (DFD)
Diagrama de Flujo de Datos (DFD)
Yaskelly Yedra
 
Mapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataMapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataJosé Rosales
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
sgcuadrado
 
Bases De Datos Paralelas
Bases De Datos ParalelasBases De Datos Paralelas
Bases De Datos Paralelas
pineda2
 
Requerimientos de un sistema de información
Requerimientos de un sistema de informaciónRequerimientos de un sistema de información
Requerimientos de un sistema de informacióncamilo_flores
 
Introduccion al análisis de sistemas de información
Introduccion al análisis de sistemas de informaciónIntroduccion al análisis de sistemas de información
Introduccion al análisis de sistemas de información
Ingeniería de Sistemas e Informática
 
Diccionario de Datos
Diccionario de DatosDiccionario de Datos
Diccionario de Datos
ALONSO UCHIHA
 
Diccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de informaciónDiccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de información
Yaskelly Yedra
 
Dax paso a paso con Power BI
Dax paso a paso con Power BIDax paso a paso con Power BI
Dax paso a paso con Power BI
JOSE AHIAS LOPEZ PORTILLO
 
Arquitectura de Datos
Arquitectura de DatosArquitectura de Datos
Arquitectura de DatosJazmin Glez.
 
Bases de datos deductivas
Bases de datos deductivas Bases de datos deductivas
Bases de datos deductivas
natar25
 
Concepto y extensiones de negocio de Eriksson Penker
Concepto y extensiones de negocio de Eriksson PenkerConcepto y extensiones de negocio de Eriksson Penker
Concepto y extensiones de negocio de Eriksson Penker
Marcos Omar Cruz Ortrega
 
IN Unidad 1: Introducción a la inteligencia de negocios
IN Unidad 1: Introducción a la inteligencia de negociosIN Unidad 1: Introducción a la inteligencia de negocios
IN Unidad 1: Introducción a la inteligencia de negocios
Franklin Parrales Bravo
 
Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datos
Flv Martín
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
nestor
 

La actualidad más candente (20)

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
 
Diagrama de Flujo de Datos (DFD)
Diagrama de Flujo de Datos (DFD)Diagrama de Flujo de Datos (DFD)
Diagrama de Flujo de Datos (DFD)
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Mapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigDataMapa Conceptual del Concepto de BigData
Mapa Conceptual del Concepto de BigData
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Bases De Datos Paralelas
Bases De Datos ParalelasBases De Datos Paralelas
Bases De Datos Paralelas
 
Conceptos basicos
Conceptos basicosConceptos basicos
Conceptos basicos
 
Requerimientos de un sistema de información
Requerimientos de un sistema de informaciónRequerimientos de un sistema de información
Requerimientos de un sistema de información
 
Introduccion al análisis de sistemas de información
Introduccion al análisis de sistemas de informaciónIntroduccion al análisis de sistemas de información
Introduccion al análisis de sistemas de información
 
Diccionario de Datos
Diccionario de DatosDiccionario de Datos
Diccionario de Datos
 
Diccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de informaciónDiccionario de datos en los sistemas de información
Diccionario de datos en los sistemas de información
 
Dax paso a paso con Power BI
Dax paso a paso con Power BIDax paso a paso con Power BI
Dax paso a paso con Power BI
 
Arquitectura de Datos
Arquitectura de DatosArquitectura de Datos
Arquitectura de Datos
 
Bases de datos deductivas
Bases de datos deductivas Bases de datos deductivas
Bases de datos deductivas
 
Concepto y extensiones de negocio de Eriksson Penker
Concepto y extensiones de negocio de Eriksson PenkerConcepto y extensiones de negocio de Eriksson Penker
Concepto y extensiones de negocio de Eriksson Penker
 
IN Unidad 1: Introducción a la inteligencia de negocios
IN Unidad 1: Introducción a la inteligencia de negociosIN Unidad 1: Introducción a la inteligencia de negocios
IN Unidad 1: Introducción a la inteligencia de negocios
 
Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datos
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 

Similar a Big Data en el entorno Bancario

Querona
QueronaQuerona
Querona
Synergo!
 
BI - Componentes de BI.pptx
BI - Componentes de BI.pptxBI - Componentes de BI.pptx
BI - Componentes de BI.pptx
JOHNATANSTEVENPALOMG
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
Joseph Lopez
 
3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos
IT-NOVA
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con Pentaho
Datalytics
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Denodo
 
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxJASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
IT-NOVA
 
Data mart
Data martData mart
Data mart
Anyeni Garay
 
Oracle
OracleOracle
PPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.pptPPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.ppt
Sandro Ernesto Ruiz Samaniego
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
CarlosRodrigo99
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
Andres Eyherabide
 
Oracle, Informix
Oracle, InformixOracle, Informix
Oracle, Informix
allison tl
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
CarlosTenelema1
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
denniscarrillo10
 
Oracle data integrator (odi)
Oracle data integrator (odi)Oracle data integrator (odi)
Oracle data integrator (odi)
Leonel Ibarra
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI
NexTReT
 
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoMejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Denodo
 
Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETL
Jorge Bustillos
 

Similar a Big Data en el entorno Bancario (20)

Querona
QueronaQuerona
Querona
 
BI - Componentes de BI.pptx
BI - Componentes de BI.pptxBI - Componentes de BI.pptx
BI - Componentes de BI.pptx
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con Pentaho
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxJASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
 
Capitulo 2 introducción al business intelligence
Capitulo 2   introducción al business intelligenceCapitulo 2   introducción al business intelligence
Capitulo 2 introducción al business intelligence
 
Data mart
Data martData mart
Data mart
 
Oracle
OracleOracle
Oracle
 
PPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.pptPPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.ppt
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
 
Oracle, Informix
Oracle, InformixOracle, Informix
Oracle, Informix
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
 
Oracle data integrator (odi)
Oracle data integrator (odi)Oracle data integrator (odi)
Oracle data integrator (odi)
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI
 
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoMejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
 
Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETL
 

Último

Sitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajasSitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajas
paulroyal74
 
herramientas de sitio web 3.0 2024
herramientas de sitio web 3.0  2024herramientas de sitio web 3.0  2024
herramientas de sitio web 3.0 2024
julio05042006
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
SamuelRamirez83524
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
JulyMuoz18
 
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB  S2. PARA VSATMANUAL DEL DECODIFICADOR DVB  S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
Ing. Julio Iván Mera Casas
 
Computacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajasComputacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajas
sofiahuarancabellido
 
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
sarasofiamontezuma
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
JimmyTejadaSalizar
 
Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
NicandroMartinez2
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
evelinglilibethpeafi
 
IA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticulturaIA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticultura
Miguel Rebollo
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
ItsSofi
 
Actividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdfActividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdf
NajwaNimri1
 
HERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptxHERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptx
maralache30
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
LilibethEstupian
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
cristianrb0324
 
Todo sobre Minirobotica. Revista Saber Electronica
Todo sobre  Minirobotica. Revista Saber ElectronicaTodo sobre  Minirobotica. Revista Saber Electronica
Todo sobre Minirobotica. Revista Saber Electronica
Carlos Carlosnoemi
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Festibity
 
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
marianabz2403
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
CesarPazosQuispe
 

Último (20)

Sitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajasSitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajas
 
herramientas de sitio web 3.0 2024
herramientas de sitio web 3.0  2024herramientas de sitio web 3.0  2024
herramientas de sitio web 3.0 2024
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
 
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB  S2. PARA VSATMANUAL DEL DECODIFICADOR DVB  S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
 
Computacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajasComputacion cuántica y sus ventajas y desventajas
Computacion cuántica y sus ventajas y desventajas
 
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
 
Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
 
IA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticulturaIA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticultura
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
 
Actividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdfActividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdf
 
HERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptxHERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptx
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
 
Todo sobre Minirobotica. Revista Saber Electronica
Todo sobre  Minirobotica. Revista Saber ElectronicaTodo sobre  Minirobotica. Revista Saber Electronica
Todo sobre Minirobotica. Revista Saber Electronica
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
 
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
 

Big Data en el entorno Bancario

  • 1. Big Data en el Entorno Bancario Martín Cabrera Technology Director Everis, an NTT DATA Company @dmcabrera martin.cabrera.aguilar@everis.com
  • 2. Enteprise Data Warehouse Cubos Sistemas Transaccionales (OLTP) Integración y Consolidación Operaciones y Analítica Arquitectura de Datos Tradicional CRM ERP Web Channel Call Center ETL Datamart Datamart ETL Reportes Operativos y Analíticos CRM ERP Modelamiento y minería de datos ETL Auditoría
  • 3. Gaps de la Arquitectura de Datos Tradicional • Soporte de volúmenes de datos limitado a nivel de los sistemas OLTP • Integración y consolidación compleja a través de procesos ETL • Excesiva normalización y rigidez a nivel de los esquemas de datos • No es compatible con la carga de fuentes de datos no estructuradas • No soporta naturalmente la implementación de real-time analytics • Capacidad de escalamiento y elasticidad limitados y de alto costo • Pensada principalmente para el mundo on- premise, lo que dificulta su extensión hacia el Cloud 30% 50% 20% Workloads ETL Operaciones Analíticos No esta preparada para la Transformación Digital
  • 4. Arquitectura de Datos Moderna Hadoop Distributed File System (HDFS) Otro EDW DM DM Data Access APIs OLTP OLTP OLTP Workload Interactivo Workload Real-time Workload Batch Workload Analítico Fuentes de Datos No Estructuradas Documentos y Correos Web Logs & Click Streams Social Networks Cloud-based Services Sensors Data Geo-location Data
  • 5. ¿Cómo resuelve los gaps la Arquitectura de Datos Moderna? • Eliminando la separación conceptual y física de los datos OLTP y los datos Analíticos a partir de una Arquitectura de Datos unificada • Eliminando las clásicas limitaciones de manejo de volúmenes de información restringidos • Soportando bajo una misma plataforma todos los workloads requeridos actualmente, Interactivo, Real-time, Batch y Analítico • Integrándose con los activos de datos existentes como el EDW, los DataMarts y las bases de datos OLTP más las fuentes de datos no estructuradas. • Generando la figura de un Enterprise Data Lake disponible para toda la corporación. • Siendo compatible con arquitecturas de tipo Cloud-Híbrida 20% 40% 40% Workloads ETL Operaciones Analíticos Siendo un habilitador fundamental para la implementación de productos y servicios digitales
  • 6. Resumen Comparativo • Volúmenes de datos limitados y capacidad de escalamiento vertical. • Separación conceptual y física de datos OLTP y datos analíticos rellenorellenorellen.o • Excesiva normalización y rigidez a nivel de los esquemas de datos. • Limitaciones importantes para resolver workloads de Real-time analytics rellenorellenorelleno • No preparada para soportar el desarrollo de productos y servicios digitales • Pensada principalmente para el mundo on-premise. Arquitectura de Datos Tradicional • Volúmenes de datos ilimitados con capacidad de escalamiento horizontal. • Arquitectura de datos Unificada que integra fuentes de datos estructuradas y no estructuradas. • Esquemas flexibles diseñados para cambiar frecuentemente. • Diseñada para soportar cualquier tipo de workload, Interactivo, Real-time, Batch y Analítico. • Fundamental para la implementación de productos y servicios digitales • Compatible con cualquier arquitectura Cloud (privada, pública, híbrida). Arquitectura de Datos Moderna
  • 7. Web/Móvil Sucursales Callcente r ETL Enteprise Data Warehouse Inteligencia de Clientes Modelos Predictivos Campañas Push Modelos Riesgo Reportes Pérdida de Información al momento de transformar los datos Existen datos que no estamos procesando (ej: logs) No soporta la implementación de servicios de Real-Time Analytics Capacidad Analítica limitada a los datos disponibles Baja capacidad de impulsar la práctica de Data Discovery Escenario actual en la Banca Riesgo Canales Operacione s
  • 8. Carga incremental (en near-real- time) de todas las fuentes de información relevantes. Carga de fuentes no estructuradas como logs, correos e información de redes sociales. Escenario futuro (Big Data) Real-time Analytics API Campañas Real-time Data Insight Discovery Logs Logs Logs Big Data Enterprise Platform (Data Lake) EL ETL Web/Móvil Sucursales Callcente r ETL Enteprise Data Warehouse Modelos Predictivos Campañas Push Modelos Riesgo Reportes Data Scientists Capacidad analítica potenciada por nuevas fuentes de información Soporta la implementación de servicios real-time y la práctica de Discovery de datos Machine Learning based models Inteligenci a de Clientes Riesgo Canales Operacione s
  • 9. ¿Cuáles serían los casos de uso más comunes de Big Data en la Banca y la arquitectura sugerida?
  • 10. Enterprise Data Warehouse offloading Enterprise Data Warehouse OLTP ETL 1 2 Movemos información de menor valor y/o histórica desde el EDW a Hadoop ocupando Sqoop También podemos replicar la información en Hadoop para derivar carga de explotación Equipos Explotació n 3 4 Los equipos explotan la información con las mismas herramientas que ocupan actualmente.
  • 11. Enterprise Data Lake Enterprise Data Warehouse (EDW) ETL 1 Equipos Explotació n 3 4 OLTP OLTP Las bases de datos OLTP más importantes se cargan as-is en Hadoop en modalidad Batch ETL 2 El EDW puede ser cargado desde el Data Lake en Hadoop a través de procesos ETL
  • 12. Enterprise Data Lake + Nuevas Fuentes Enterprise Data Warehouse (EDW) ETL 1 Equipos Explotación 4 5 OLTP El Data Lake incorpora fuentes de datos No Estructuradas en modalidad Batch ETL 3 Logs OLTP Logs 2 Data Scientists Data Insight Discovery (Aster Data) Advanced Analytics (Mahout, R) Cognitive Analytics (IBM Watson)
  • 13. Near-Real-Time Data Ingestion Enterprise Data Warehouse (EDW) Equipos Explotació n 4 5 OLTP Los agentes de Flume hacen streaming de la información generada ETL 3 Logs OLTP Logs Flume Agent Flume Agent Flume Agent Los Interceptors de Flume permiten enriquecer la ingesta de datos para finalmente guardarla en HDFS (Hadoop) 1 2 Data Scientists Data Insight Discovery (Aster Data) Advanced Analytics (Mahout, R) Cognitive Analytics (IBM Watson)
  • 14. Real-Time Analytics con HBase OLTP Logs OLTP Logs Flume Agent Flume Agent Flume Agent En el proceso de ingesta de datos, se guarda información en HBase que posteriormente servirá como input para los servicios Real-Time (ej: el consumo acumulado diario por rubro de un cliente con tarjeta de crédito). 1 Real-Time Analytics Services API 2 3 El servicio real-time (expuesto como API) es consumido por ejemplo por la aplicación móvil cada vez que el cliente realiza un pago con tarjeta. Con la estructura clave-valor en HBase, el servicio puede advertir al cliente de un consumo excesivo en su tarjeta e inclusive compararlo con meses y años anteriores.
  • 15. Real-Time Analytics con HBase+Spark OLTP Logs OLTP Logs Flume Agent Flume Agent Flume Agent 1 Real-Time Analytics Services API 3 Spark permite crear un Resilient Distributed Dataset (RDD) a partir de datos en HDFS, HBase, etc. Su capacidad de representar los datos en memoria y de procesar los mismos de manera distribuida, permite crear servicios de real-time analytics avanzados que requieran procesar grandes volúmenes de datos. 2
  • 16. Ejemplo Digital Journey soportado por BigData Web Red Social El usuario se conecta a www.banco.cl La aplicación le indica que se registre con sus credenciales de Twitter / Facebook o Linkedin El usuario selecciona Linkedin y la aplicación solicita permisos para acceder a su perfil y su lista de contactos La aplicación le muestra sus datos, le solicita que ingrese su número de móvil, una clave segura y le envía por SMS un código de enrolamiento para su dispositivo. Móvil El usuario recibe el código de enrolamiento para confirmar su regsitro El usuario confirma su registro y ya es “Cliente Registrado”. La aplicación le da la Bienvenida y la indica que 36 de sus contactos en Linkedin ya son clientes del Banco y que 22 de ellos tienen Cta Cte y Tarjeta de Crédito, mientras que 18 tienen productos de inversión, invitándolo a contratar dichos productos Email El cliente recibe un correo de bienvenida, con la misma información de sus contactos que está viendo en la aplicación web y con la invitación a seguir explorando los productos del Banco
  • 17. Resumiendo • Los Bancos (y todos los negocios digitales) necesitan una Arquitectura de Datos Moderna que soporte el procesamiento de grandes volúmenes de información (Big Data). • El foco inicial debe estar puesto en la implementación de una Plataforma de Big Data Corporativa, tanto para fines analíticos como operativos. • Los casos de uso más implementados son: • Database offloading • Enterprise Data Lake • Near-Real-Time Data Ingestion • Real-Time Analytics
  • 18. Big Data en el Entorno Bancario Martín Cabrera Technology Director Everis, an NTT DATA Company @dmcabrera martin.cabrera.aguilar@everis.com