SlideShare una empresa de Scribd logo
1 de 41
Descargar para leer sin conexión
diciembre 2010
Big data
Architectures and Practical use cases
juantomas@aspgems.com

@juantomas
Data Everywhere
Big Data
Big data es el análisis de la información para identificar tendencias, patrones y
conocimientos que nos permitan tomar mejores decisiones de negocio
La oportunidad
Las nuevas tecnologías para el tratamiento
de datos hacen posible gestionar y analizar
todos los datos disponiblesen su forma
nativa:
no estructurada
estructurada
streaming
Impacto en el negocio
Agilidad Operativa
Analizar todos los datos operativos disponibles, reaccionar en tiempo real
y optimizar los procesos.
Conocer todo acerca de nuestros cliente
Analizar todas las fuentes de datos para conocer a nuestros clientes y
personalizar la oferta de productos y servicios de las interacciones de
canal, a los medios de comunicación social.
Prevención del Fraude y Riesgo
Desarrollar mejores modelos de fraude / riesgo mediante el análisis de
todos los datos disponibles, y detectar el fraude en tiempo real con el
análisis de las transacciones de streaming.
Impulsar y escalar la innovación
Captura todas las fuentes de datos retroalimentación y análisis de grandes
cantidades de datos para el desarrollo de nuevos productos y servicios.
ASP Value add
Descubrimiento, visualización y
navegación de datos.
Analisis Agil de los datos para mejorar la
visión de negocio e identificar nuevas
oportunidades.
Analisis en streaming de los datos para la
toma de decisones en tiempo real.
Soluciones ágiles en base a tecnologías
abiertas
Analisis Àgil
Necesidad del cliente
Ingerir datos tal y como son en Hadoop y obtener una visión de ella
Proceso de grandes volúmenes de datos diversos dentro de Hadoop
Combinar conocimientos con el almacén de datos
Analis nálisis ad-hoc para probar nuevas hipótesis
Proposición de Valor
Adquirir nuevos conocimientos a partir de una variedad y combinación de
fuentes de datos
Superar el costo prohibitivo de la conversión fuentes de datos no
estructurados a un formato estructurado
Extender el valor del almacén de datos mediante la incorporación de
nuevos tipos de datos y la conducción de nuevos tipos de análisis
Experimentar con el análisis de diferentes combinaciones de datos para
modificar los modelos analíticos en el almacén de datos
Ejemplos de clientes
Oferta personalizada de servicos financieros en Monty
Streaming de datos
Necesidad del cliente
Captura y proceso de datos en tiempo real, selección y agregación de información valiosa de negocio para su
posterior procesamiento
Proceso y analice de los datos perecederos, para la toma las decisiones oportunas.
Proposición de Valor
Se ha reducido significativamente el tiempo de procesamiento y costo - proceso y luego almacenar lo que es valioso
Reaccionar en tiempo real para capturar oportunidades antes de que caduquen
Ejemplos de clientes
Pedro Sanz - Generación automatica de oferttas personalizadas para captar y retener los clientes.
Descubrimiento y Navegación
Necesidad del cliente
Comprender las fuentes de datos existentes
Exponer los datos dentro existente sistemas de archivos de gestión de
contenidos y para nuevos usos, sin copiar el datos a una ubicación
central
Buscar y navegar por grandes datos de orígenes multicana
Proposición de Valor
Póngase en marcha rápidamente ydescubrir y recuperar grandes
datos relevantes
Utilizar fuentes de datos grandes en nuevo aplicaciones centradas en la
información
Ejemplos de clientes
Telefonica MSS SAQQRA - Generacíon de una vista 360 ° de las
amenazas y vulnerabilidades de seguridad de sus clientes
Soluciones Àgiles
Necesidad del cliente
Comprender las fuentes de datos existentes
Exponer los datos dentro existente sistemas de archivos de gestión de
contenidos y para nuevos usos, sin copiar el datos a una ubicación
central
Buscar y navegar por grandes datos de orígenes multicana
Proposición de Valor
Póngase en marcha rápidamente y descubrir y recuperar grandes
datos relevantes
Utilizar fuentes de datos grandes en nuevo aplicaciones centradas en la
información
Ejemplos de clientes
Telefonica MSS SAQQRA - Generación de una vista 360 ° de las
amenazas y vulnerabilidades de seguridad de sus clientes
Es el momento
¿Preparado?
1. Define your Goals
Proceso tradicional
Convergencia de datos
Divergencia analítica
Descubre
Recopila
Filtra
Integra Aumenta
Analiza
Actúa
3-6 meses 2 meses 2-4 meses
Proceso ágil
Convergencia de datos
Divergencia analítica
Descubre
Recopila
Filtra
Integra Aumenta
Analiza
Actúa
3-6 meses 2 meses 2-4 meses
MPV, con un simple modelo de frecuencia
Mide el uso actual y sus beneficios
Aprende y evoluciona hacia una mejor comprensión
80/20
Un ejemplo
¿Qué características tienen los
clientes que nos están dejando?
¿Qué comportamientos de compra tienen
los clientes que se están yendo?
¿Cómo podemos retener a
clientes de alto valor que
están a punto de
abandonarnos?
¿Qué están diciendo los clientes que están
a punto de irse en las RRSS?
¿Podemos determinar el sentimiento de
nuestros clientes antes de irse?
¿Podemos determinar el sentimiento de
nuestros clientes antes de irse?
¿Podemos determinar el sentimiento de
nuestros clientes antes de irse?
¿Qué secuencia de eventos parece
que es la anima a nuestros clientes
a quedarse?
¿Qué secuencia de eventos parece
que es la anima a nuestros clientes
a quedarse?
Escalando la solución
Nuestra arquitectura de referencia
Arquitectura Lambda
Arquitectura Lambda
Batch-Hadoop (MR1)
Batc-MapReduce
Batch-Cascading
Batch-Spark
Batch-MPP database
Velocidad
Batch
Speed
Serving Query
query = function(all data)
All Data
Velocidad. Storm
Servicio.
Batch
Speed
Serving Query
query = function(all data)
All Data
Pull-based Batch Loads
EnterpriseData Models
Complex ETL Logic
Poorly Suited to Non-Relational Data
El diseño emergente es difícil
Arquitecturas
convencionales
Drive Towards in memory
Processing
https://www.tele-task.de/archive/lecture/overview/5721/
In memory Computing
https://www.tele-task.de/archive/lecture/overview/5721/
https://www.tele-task.de/archive/lecture/overview/5721/
Apache Spark
Data Structures
Algorithmshttps://www.flickr.com/photos/herrolsen/7645876896/
Raw Data
Data
Structure
Algorithm Insight
Estructura
Traditional Data Flow
Streaming Data Flow
aspgems.com
@aspgems
Gracias

Más contenido relacionado

La actualidad más candente

Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
Data Platform de BEEVA
Data Platform de BEEVAData Platform de BEEVA
Data Platform de BEEVABEEVA_es
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsMundo Contact
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeEduardo Castro
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgSnoop Consulting
 
Customer intelligence
Customer intelligenceCustomer intelligence
Customer intelligenceDiego Arenas
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 
Data Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenData Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenSoftware Guru
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Cómo sacar provecho de la explosión de datos smart big data
Cómo sacar provecho de la explosión de datos smart big dataCómo sacar provecho de la explosión de datos smart big data
Cómo sacar provecho de la explosión de datos smart big dataAlet & CO
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
Big Data y el sector salud
Big Data y el sector saludBig Data y el sector salud
Big Data y el sector saludBEEVA_es
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 

La actualidad más candente (20)

Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Data Platform de BEEVA
Data Platform de BEEVAData Platform de BEEVA
Data Platform de BEEVA
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big Results
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
Customer intelligence
Customer intelligenceCustomer intelligence
Customer intelligence
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Data Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenData Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesen
 
Big Data & RRHH
Big Data & RRHHBig Data & RRHH
Big Data & RRHH
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 
Cómo sacar provecho de la explosión de datos smart big data
Cómo sacar provecho de la explosión de datos smart big dataCómo sacar provecho de la explosión de datos smart big data
Cómo sacar provecho de la explosión de datos smart big data
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
Dataminning
DataminningDataminning
Dataminning
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Big Data y el sector salud
Big Data y el sector saludBig Data y el sector salud
Big Data y el sector salud
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 

Similar a Big data arquitecturas y casos prácticos

QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?
QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?
QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?Edwin Alexis SemiNArio Beltran
 
Servicios Business Analytics
Servicios Business AnalyticsServicios Business Analytics
Servicios Business AnalyticsViewnext
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Aplicación de analítica de clientes para anticipar fuga de clientes
Aplicación de analítica de clientes para anticipar fuga de clientesAplicación de analítica de clientes para anticipar fuga de clientes
Aplicación de analítica de clientes para anticipar fuga de clientesIntellego Chile
 
Estrategia basada en información
Estrategia basada en informaciónEstrategia basada en información
Estrategia basada en informaciónRoberto Esteves
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
introduccion aministracion industrial con inteligencia de negocios
introduccion aministracion industrial con inteligencia de negociosintroduccion aministracion industrial con inteligencia de negocios
introduccion aministracion industrial con inteligencia de negociosammadrid699
 
SAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANASAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANAjorge507504
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Analytics10
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stackEduardo Castro
 
Perspectivas de Minería de Datos en Empresas de Crédito y Ahorro
Perspectivas de Minería de Datos en Empresas de Crédito y AhorroPerspectivas de Minería de Datos en Empresas de Crédito y Ahorro
Perspectivas de Minería de Datos en Empresas de Crédito y AhorroOscar Calva
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big DataICEMD
 
TGS-HP-AnalíticadeDatos-ES-r01
TGS-HP-AnalíticadeDatos-ES-r01TGS-HP-AnalíticadeDatos-ES-r01
TGS-HP-AnalíticadeDatos-ES-r01Itconic
 
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningGerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningSunnely Sequera
 

Similar a Big data arquitecturas y casos prácticos (20)

QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?
QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?
QUE IMPLICA QUE TODA ESTA INFORMACIÓN SE ENCUENTRE DISPONIBLE?
 
Copy of Charla Cibertec DAT.ppt
Copy of Charla Cibertec DAT.pptCopy of Charla Cibertec DAT.ppt
Copy of Charla Cibertec DAT.ppt
 
Introducción a la Minería de Datos (1).pdf
Introducción a la Minería de Datos (1).pdfIntroducción a la Minería de Datos (1).pdf
Introducción a la Minería de Datos (1).pdf
 
Marketing analytics
Marketing analyticsMarketing analytics
Marketing analytics
 
Servicios Business Analytics
Servicios Business AnalyticsServicios Business Analytics
Servicios Business Analytics
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Bigdata
BigdataBigdata
Bigdata
 
Aplicación de analítica de clientes para anticipar fuga de clientes
Aplicación de analítica de clientes para anticipar fuga de clientesAplicación de analítica de clientes para anticipar fuga de clientes
Aplicación de analítica de clientes para anticipar fuga de clientes
 
Estrategia basada en información
Estrategia basada en informaciónEstrategia basada en información
Estrategia basada en información
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
introduccion aministracion industrial con inteligencia de negocios
introduccion aministracion industrial con inteligencia de negociosintroduccion aministracion industrial con inteligencia de negocios
introduccion aministracion industrial con inteligencia de negocios
 
SAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANASAS BUSINESS ANALYTICS PARA REALIZAR ANA
SAS BUSINESS ANALYTICS PARA REALIZAR ANA
 
Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera Presentacion A10 Big Data_Alteryx_Cloudera
Presentacion A10 Big Data_Alteryx_Cloudera
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stack
 
Perspectivas de Minería de Datos en Empresas de Crédito y Ahorro
Perspectivas de Minería de Datos en Empresas de Crédito y AhorroPerspectivas de Minería de Datos en Empresas de Crédito y Ahorro
Perspectivas de Minería de Datos en Empresas de Crédito y Ahorro
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
TGS-HP-AnalíticadeDatos-ES-r01
TGS-HP-AnalíticadeDatos-ES-r01TGS-HP-AnalíticadeDatos-ES-r01
TGS-HP-AnalíticadeDatos-ES-r01
 
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningGerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
 

Más de Juantomás García Molina

#AbadIA machine learning pipelines commit conf 2019
#AbadIA   machine learning pipelines commit conf 2019#AbadIA   machine learning pipelines commit conf 2019
#AbadIA machine learning pipelines commit conf 2019Juantomás García Molina
 
AbadIA: the abbey of the crime AI - GDG Cloud London 2018
AbadIA:  the abbey of the crime AI - GDG Cloud London 2018AbadIA:  the abbey of the crime AI - GDG Cloud London 2018
AbadIA: the abbey of the crime AI - GDG Cloud London 2018Juantomás García Molina
 
#AbadIA: the abbey of the crime AI - IO18 extended madrid 2018
#AbadIA:  the abbey of the crime AI - IO18 extended madrid 2018#AbadIA:  the abbey of the crime AI - IO18 extended madrid 2018
#AbadIA: the abbey of the crime AI - IO18 extended madrid 2018Juantomás García Molina
 
#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018
#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018
#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018Juantomás García Molina
 
AbadIA: the abbey of the crime AI - Vaas Madrid 2018
AbadIA: the abbey of the crime AI - Vaas Madrid 2018AbadIA: the abbey of the crime AI - Vaas Madrid 2018
AbadIA: the abbey of the crime AI - Vaas Madrid 2018Juantomás García Molina
 
From Alpha Go to Alpha Zero - Vaas Madrid 2018
From Alpha Go to Alpha Zero -  Vaas Madrid 2018From Alpha Go to Alpha Zero -  Vaas Madrid 2018
From Alpha Go to Alpha Zero - Vaas Madrid 2018Juantomás García Molina
 
Codemotion madrid 2017 Arquitectura kappa 2.0
Codemotion madrid 2017  Arquitectura kappa 2.0Codemotion madrid 2017  Arquitectura kappa 2.0
Codemotion madrid 2017 Arquitectura kappa 2.0Juantomás García Molina
 
Meetup big data developers 2017 madrid - spark real use cases
Meetup big data developers 2017 madrid - spark real use casesMeetup big data developers 2017 madrid - spark real use cases
Meetup big data developers 2017 madrid - spark real use casesJuantomás García Molina
 
Gdg cloud london 2017 kappa architecture 2.0 copia
Gdg cloud london 2017   kappa architecture 2.0 copiaGdg cloud london 2017   kappa architecture 2.0 copia
Gdg cloud london 2017 kappa architecture 2.0 copiaJuantomás García Molina
 
Datascience lab 2017 odessa kappa architecture 2.0
Datascience lab 2017 odessa   kappa architecture 2.0Datascience lab 2017 odessa   kappa architecture 2.0
Datascience lab 2017 odessa kappa architecture 2.0Juantomás García Molina
 
Databeers madrid 2017 - Paas pigeons as a service
Databeers madrid 2017 - Paas pigeons as a serviceDatabeers madrid 2017 - Paas pigeons as a service
Databeers madrid 2017 - Paas pigeons as a serviceJuantomás García Molina
 

Más de Juantomás García Molina (20)

#AbadIA machine learning pipelines commit conf 2019
#AbadIA   machine learning pipelines commit conf 2019#AbadIA   machine learning pipelines commit conf 2019
#AbadIA machine learning pipelines commit conf 2019
 
AbadIA - sphere it krakow 2019
AbadIA -   sphere it krakow 2019AbadIA -   sphere it krakow 2019
AbadIA - sphere it krakow 2019
 
AbadIA ING Direct - Madrid 2019
AbadIA ING Direct - Madrid 2019AbadIA ING Direct - Madrid 2019
AbadIA ING Direct - Madrid 2019
 
AbadIA US Secret Tour - Pittsburgh'19
AbadIA US Secret Tour - Pittsburgh'19AbadIA US Secret Tour - Pittsburgh'19
AbadIA US Secret Tour - Pittsburgh'19
 
From alpha go to alpha zero TLP innova 2018
From alpha go to alpha zero  TLP innova 2018From alpha go to alpha zero  TLP innova 2018
From alpha go to alpha zero TLP innova 2018
 
AbadIA: the abbey of the crime AI - GDG Cloud London 2018
AbadIA:  the abbey of the crime AI - GDG Cloud London 2018AbadIA:  the abbey of the crime AI - GDG Cloud London 2018
AbadIA: the abbey of the crime AI - GDG Cloud London 2018
 
#AbadIA: the abbey of the crime AI - IO18 extended madrid 2018
#AbadIA:  the abbey of the crime AI - IO18 extended madrid 2018#AbadIA:  the abbey of the crime AI - IO18 extended madrid 2018
#AbadIA: the abbey of the crime AI - IO18 extended madrid 2018
 
#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018
#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018
#AbadIA: the abbey of the crime AI - IBM meetup Madrid 2018
 
AbadIA: the abbey of the crime AI - Vaas Madrid 2018
AbadIA: the abbey of the crime AI - Vaas Madrid 2018AbadIA: the abbey of the crime AI - Vaas Madrid 2018
AbadIA: the abbey of the crime AI - Vaas Madrid 2018
 
From Alpha Go to Alpha Zero - Vaas Madrid 2018
From Alpha Go to Alpha Zero -  Vaas Madrid 2018From Alpha Go to Alpha Zero -  Vaas Madrid 2018
From Alpha Go to Alpha Zero - Vaas Madrid 2018
 
Alpha zero - London 2018
Alpha zero  - London 2018 Alpha zero  - London 2018
Alpha zero - London 2018
 
Codemotion madrid 2017 Arquitectura kappa 2.0
Codemotion madrid 2017  Arquitectura kappa 2.0Codemotion madrid 2017  Arquitectura kappa 2.0
Codemotion madrid 2017 Arquitectura kappa 2.0
 
JBCN barcelona 2017 kappa architecture 2.0
JBCN barcelona 2017 kappa architecture 2.0JBCN barcelona 2017 kappa architecture 2.0
JBCN barcelona 2017 kappa architecture 2.0
 
Meetup big data developers 2017 madrid - spark real use cases
Meetup big data developers 2017 madrid - spark real use casesMeetup big data developers 2017 madrid - spark real use cases
Meetup big data developers 2017 madrid - spark real use cases
 
Gdg cloud madrid 2017 - GDG kick off metuup
Gdg cloud madrid 2017  - GDG kick off metuupGdg cloud madrid 2017  - GDG kick off metuup
Gdg cloud madrid 2017 - GDG kick off metuup
 
Scalaua 2017 kyev kappa architecture 2.0
Scalaua 2017 kyev   kappa architecture 2.0Scalaua 2017 kyev   kappa architecture 2.0
Scalaua 2017 kyev kappa architecture 2.0
 
Icea 2017 big data - recursos humanos
Icea 2017   big data - recursos humanosIcea 2017   big data - recursos humanos
Icea 2017 big data - recursos humanos
 
Gdg cloud london 2017 kappa architecture 2.0 copia
Gdg cloud london 2017   kappa architecture 2.0 copiaGdg cloud london 2017   kappa architecture 2.0 copia
Gdg cloud london 2017 kappa architecture 2.0 copia
 
Datascience lab 2017 odessa kappa architecture 2.0
Datascience lab 2017 odessa   kappa architecture 2.0Datascience lab 2017 odessa   kappa architecture 2.0
Datascience lab 2017 odessa kappa architecture 2.0
 
Databeers madrid 2017 - Paas pigeons as a service
Databeers madrid 2017 - Paas pigeons as a serviceDatabeers madrid 2017 - Paas pigeons as a service
Databeers madrid 2017 - Paas pigeons as a service
 

Último

Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 

Último (20)

Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 

Big data arquitecturas y casos prácticos

  • 1. diciembre 2010 Big data Architectures and Practical use cases juantomas@aspgems.com @juantomas
  • 3. Big Data Big data es el análisis de la información para identificar tendencias, patrones y conocimientos que nos permitan tomar mejores decisiones de negocio
  • 4. La oportunidad Las nuevas tecnologías para el tratamiento de datos hacen posible gestionar y analizar todos los datos disponiblesen su forma nativa: no estructurada estructurada streaming
  • 5. Impacto en el negocio Agilidad Operativa Analizar todos los datos operativos disponibles, reaccionar en tiempo real y optimizar los procesos. Conocer todo acerca de nuestros cliente Analizar todas las fuentes de datos para conocer a nuestros clientes y personalizar la oferta de productos y servicios de las interacciones de canal, a los medios de comunicación social. Prevención del Fraude y Riesgo Desarrollar mejores modelos de fraude / riesgo mediante el análisis de todos los datos disponibles, y detectar el fraude en tiempo real con el análisis de las transacciones de streaming. Impulsar y escalar la innovación Captura todas las fuentes de datos retroalimentación y análisis de grandes cantidades de datos para el desarrollo de nuevos productos y servicios.
  • 6. ASP Value add Descubrimiento, visualización y navegación de datos. Analisis Agil de los datos para mejorar la visión de negocio e identificar nuevas oportunidades. Analisis en streaming de los datos para la toma de decisones en tiempo real. Soluciones ágiles en base a tecnologías abiertas
  • 7. Analisis Àgil Necesidad del cliente Ingerir datos tal y como son en Hadoop y obtener una visión de ella Proceso de grandes volúmenes de datos diversos dentro de Hadoop Combinar conocimientos con el almacén de datos Analis nálisis ad-hoc para probar nuevas hipótesis Proposición de Valor Adquirir nuevos conocimientos a partir de una variedad y combinación de fuentes de datos Superar el costo prohibitivo de la conversión fuentes de datos no estructurados a un formato estructurado Extender el valor del almacén de datos mediante la incorporación de nuevos tipos de datos y la conducción de nuevos tipos de análisis Experimentar con el análisis de diferentes combinaciones de datos para modificar los modelos analíticos en el almacén de datos Ejemplos de clientes Oferta personalizada de servicos financieros en Monty
  • 8. Streaming de datos Necesidad del cliente Captura y proceso de datos en tiempo real, selección y agregación de información valiosa de negocio para su posterior procesamiento Proceso y analice de los datos perecederos, para la toma las decisiones oportunas. Proposición de Valor Se ha reducido significativamente el tiempo de procesamiento y costo - proceso y luego almacenar lo que es valioso Reaccionar en tiempo real para capturar oportunidades antes de que caduquen Ejemplos de clientes Pedro Sanz - Generación automatica de oferttas personalizadas para captar y retener los clientes.
  • 9. Descubrimiento y Navegación Necesidad del cliente Comprender las fuentes de datos existentes Exponer los datos dentro existente sistemas de archivos de gestión de contenidos y para nuevos usos, sin copiar el datos a una ubicación central Buscar y navegar por grandes datos de orígenes multicana Proposición de Valor Póngase en marcha rápidamente ydescubrir y recuperar grandes datos relevantes Utilizar fuentes de datos grandes en nuevo aplicaciones centradas en la información Ejemplos de clientes Telefonica MSS SAQQRA - Generacíon de una vista 360 ° de las amenazas y vulnerabilidades de seguridad de sus clientes
  • 10. Soluciones Àgiles Necesidad del cliente Comprender las fuentes de datos existentes Exponer los datos dentro existente sistemas de archivos de gestión de contenidos y para nuevos usos, sin copiar el datos a una ubicación central Buscar y navegar por grandes datos de orígenes multicana Proposición de Valor Póngase en marcha rápidamente y descubrir y recuperar grandes datos relevantes Utilizar fuentes de datos grandes en nuevo aplicaciones centradas en la información Ejemplos de clientes Telefonica MSS SAQQRA - Generación de una vista 360 ° de las amenazas y vulnerabilidades de seguridad de sus clientes
  • 13. 1. Define your Goals
  • 14. Proceso tradicional Convergencia de datos Divergencia analítica Descubre Recopila Filtra Integra Aumenta Analiza Actúa 3-6 meses 2 meses 2-4 meses
  • 15. Proceso ágil Convergencia de datos Divergencia analítica Descubre Recopila Filtra Integra Aumenta Analiza Actúa 3-6 meses 2 meses 2-4 meses MPV, con un simple modelo de frecuencia Mide el uso actual y sus beneficios Aprende y evoluciona hacia una mejor comprensión
  • 16. 80/20
  • 17. Un ejemplo ¿Qué características tienen los clientes que nos están dejando? ¿Qué comportamientos de compra tienen los clientes que se están yendo? ¿Cómo podemos retener a clientes de alto valor que están a punto de abandonarnos? ¿Qué están diciendo los clientes que están a punto de irse en las RRSS? ¿Podemos determinar el sentimiento de nuestros clientes antes de irse? ¿Podemos determinar el sentimiento de nuestros clientes antes de irse? ¿Podemos determinar el sentimiento de nuestros clientes antes de irse? ¿Qué secuencia de eventos parece que es la anima a nuestros clientes a quedarse? ¿Qué secuencia de eventos parece que es la anima a nuestros clientes a quedarse?
  • 18. Escalando la solución Nuestra arquitectura de referencia
  • 26. Velocidad Batch Speed Serving Query query = function(all data) All Data
  • 28. Servicio. Batch Speed Serving Query query = function(all data) All Data
  • 29. Pull-based Batch Loads EnterpriseData Models Complex ETL Logic Poorly Suited to Non-Relational Data El diseño emergente es difícil Arquitecturas convencionales
  • 30. Drive Towards in memory Processing
  • 34.
  • 35.
  • 36.