SlideShare una empresa de Scribd logo
Big Data
Valor estratégico para el mercado corporativo
@ferparra
A. Definición de Big Data
B. Aplicaciones
C. Tecnologías
D. Mejores prácticas
E. Reflexión final
• Hacia 2020, 5,200 Gigabytes de
datos serán generados para cada ser
humano del planeta.
• Un motor de jet en un vuelo de
Londres a Nueva York genera 10
Terabytes de datos cada 30
minutos.
• El 90% de los datos del mundo
actuales fueron generados en los
últimos 2 años.
• Según MIT, las organizaciones
grandes tienen en promedio 5.000
fuentes de datos, pero 1-2% terminan
en su Data Warehouse.
• El crecimiento exponencial se torna
cada vez mas difícil de administrar.
• Los datos contienen información
poco obvia que las empresas
podrían descubrir para mejorar sus
resultados.
• Las medidas de datos son relativas.
Cada industria enfrenta desafíos de
distinto tamaño.
A. Definición de
Big Data!
B. Aplicaciones
C. Tecnologías
D. Mejores prácticas
E. Reflexión final
¿Qué es Big Data?
¿Análisis Predictivo
¿Business Intelligence?
¿Data Discovery?
¿Visualizaciones e infografías?
¿Búsqueda de texto?
¿Procesamiento de

eventos complejos?
¿Programación neurolingüística?
¿Aprendizaje profundo?
¿Inteligencia Artificial?
¿Cual es nuestra frontera?
MB GB TB PB
tabla
base
de
datos
fotos
w
eb
audio
social video
m
obile
tiem
po
real
casitiem
po
real
periodico
batch
Velocidad
Volumen
Variedad
El problema comienza a
definirse como de Big Data
cuando la frontera

se expande.
Nuestras arquitectura de
información tradicional
se torna inadecuada.
El ruido
supera
la señal
Hay buenos modelos…

y malos modelos…
El 80% del esfuerzo se
produce en la
integración de datos
La explotación de Big Data
está debajo de la superficie
alias

“Dark data"
Además, el 80% de los

datos disponibles son

no estructurados, pero…
¿equivalen al 80% del valor?
ROB (Return on Byte)!
Es el valor de un byte dividido
por el costo de almacenarlo
MAX(ROB)
¿Alto ROB?
¿Bajo ROB?
Big Data es la frontera de una
firma para almacenar, procesar y
acceder a todos los datos que
necesita para operar eficazmente,
tomar decisiones, reducir riesgos
y servir a los clientes.
A. Definición de Big Data
B. Aplicaciones!
C. Tecnologías
D. Mejores Prácticas
E. Reflexión final
Machine
learning
Procesamiento en
tiempo real
Analytics
exploratorio
Banca
Bienes de
Consumo
IT
Telcos y
comunicaciones
Servicio al
consumidor
Análisis
sentimental
Seguridad
informática
Churn
Riesgo

crediticio
Recomendación
de productos
Escabilidad de
Infraestructura
Gestión de
promociones
Detección de
Transacciones
fraudulentas
Predicción de
demanda en
tiempo real
Optimización de
protocolos
Alocación
inteligente de
capacidad
Upsell y cross-sell
de productos
Vista 360 del
consumidor
Predicción de
fallos
M2M
Gobierno y
ciudad
Biología y
Medicina
Energía y
utilidades
Internet
Predicción y
prevención del
delito
Genómica
Medidores
inteligentes
Asistente

virtual
Ciudad

inteligente
Registro de
enfermedades
Redes

mixtas
Contenido
personalizado
Digitalización de
documentos
Diagnóstico
médico en la
nube
Predicción de la
demanda
Aprendizaje
profundo
Open

Government
“Yo” cuantificado
Gestión de
energía desde el
consumidor
Internet of

Things
A. Definición de Big Data
B. Aplicaciones
C. Tecnologías!
D. Mejores prácticas
E. Reflexión final
Nuevas estructuras

de datos para

nuevos problemas
No Relacional Relacional
Hadoop!
Horton!
Cloudera!
MapR!
Zettaset!
!
!
Hadapt!
!
!
Teradata!
Aster!
EMC!
Greeplum!
IBM InfoSphere!
Netezza!
SAP HANA!
SAP Sybase IQ!
HP Vertica!
Oracle!
Times-ten!
Infobright!
ParAccel!
Calpoint!
VectorWise
Analíticas
Operativas Spark Oracle IBM DB2 SQLSrvr JustOneDB
Documentos
Lotus Notes
InterSystems!
Progress!
Objectivity!
Versant
Marklogic!
McObject
CouchDB!
MongoDB!
RavenDB
NoSQL
Clave

Valor
Big Table
Grafos
Couchbase
Riak!
Redis!
Membrain!
Voldemort!
BerkleyDB
Cassandra
HyperTable!
HBase FlockDB!
InfiniteGraph!
Neo4j!
AllegroGraph
Datos en la nube
App Engine!
SimpleDB
Amazon Redshift!
SQL Azure!
database.com
Xeround!
FathomDB
NewSQL
Sybase ASE Ingress
MySQL
PostgreSQL
EnterpriseDB
SchoonerSQL!
Tokutek!
Continuent!
Translattice!
GenieDB
ScaleBase!
CodeFutures!
VoltDB!
ScalArc!
Drizzle
HandlerSocket!
Akiban!
MySQL Cluster!
Clustix!
Tuplas
"Clave":

{ 

"valor": 0.55
}
¿Lenguaje de query?
(C) consistencia
(A) disponibilidad
(P) tolerancia a
particiones
¿NoSQL?
Elija 2
(lo sentimos)
Hadoop
• Almacenaje y procesamiento
barato y a escala.
• Es la tecnología dominante
para procesamiento distribuido
a gran escala. Crece 60%
anual a tasa compuesta.
• Sin embargo su nivel de
utilización se encuentra por
debajo del 6% en empresas.
Hadoop instala herramientas en cada nodo:
• Librerías y scripts en Java
• Un filesystem de alta

disponibilidad -> HDFS
• Una plataforma de gestión

de recursos de cómputo -> YARN
• Un motor de 

extracción -> Map-Reduce
Arquitectura básica
Fuente: Rare Mile Technologies, 26 de Junio de 2012, http://blog.raremile.com/hadoop-demystified/
MapReduce
Input -> Map(..) -> Reduce(..) -> output
Nodo 2
Nodo 3
Nodo 1
Nodo 2
Nodo 3
Nodo 1
Archivosenfilesystem
Map(..) Reduce(..)input output
Soy maestro primario… tengo una caja de
lápices de color y cajas más pequeñas
->
Caja de
lápices
Un alumno:
toma lápiz, le
pone etiqueta, y
lo vuelca en su
caja (Ejemplo:
Rojo, 1)
->
Otro alumno:
toma caja y
suma los 1s
-> Lápices

por color
input
Map(..)
Reduce(..)
output
Map Reduce
Storm!
Drill!
HANA

Spark
Alto volumen, alta latencia Alto volumen, baja latencia
Procesamiento en batch Acceso a datos en memoria
Se define proceduralmente
Son queries a bases de datos
columnares como HBase,
Cassandra o MongoDB
Es adecuado para el
procesamiento total de datos
Es adecuado para producir
reportes ah-hoc y procesamiento
en tiempo real
• Persistencia

Cassandra, HBase
• Manipulación de datos

Pig, Pandas
• Búsqueda de texto

Solr, Lucene
Tecnologías complementarias
que hay que saber obligado
Tecnologías complementarias
que hay que saber obligado
• Machine Learning

Mahout, R, SAS, MADLib
• Real-time processing

Drill, Storm, Impala
• In-memory

SAP HANA, Apache Spark
fácil ranking de ventas por
región
difícil clientes que estén por
dejar el servicio
ultra difícil clientes que
muestran insatisfacción sobre
problemas aún no identificados
Consulta SQL
Clasificador
Programación
neuro linguistica
¿Con qué sentido
sumergirnos entre tanta
complejidad?
fácil ranking de ventas por
región
difícil clientes que estén por
dejar el servicio
ultra difícil clientes que
muestran insatisfacción sobre
problemas aún no identificados
Microstrategy
Modelo en R
Luminoso
Las bases de datos columnares
tienen grandes beneficios
• Aprovechamiento de procesamiento
masivo en paralelo (MPP).
• Posibilitan el almacenamiento en
memoria RAM.
• Fáciles de administrar y de leer

(viejo y conocido SQL)
• Soportan un volumen del orden de
los TBs sin problemas
Analytics in-database y funciones
definidas por el usuario
• Ganancia cualitativa en performance.
• Compatibles con lenguajes de markup
para aplicaciones de Data Mining
(PMML)
• Contendientes: Aster Data, Vertica,
Netezza, Greenplum (EMC), ParAccel,
SAP Sybase
Columnar + In-Database analytics =
A. Definición de Big Data
B. Aplicaciones
C. Tecnologías
D. Mejores prácticas!
E. Reflexión final
Algunas Mejores
prácticas
1. Partir siempre de una hipótesis
antes de actuar sobre los datos
2. No construir Legacy
3. Definir una “autopista de la
información”
4. Seguir pensando en dimensiones e
indicadores
Algunas Mejores
prácticas
5. Construir una infraestructura
flexible y escalable (la nube)
6. Implementar flujos conectados a
las etapas de caché anteriores
7. Los datos mas próximos van a ser
sucios, pero debe agregarse valor
en la etapas subsiguientes
A. Definición de Big Data
B. Aplicaciones
C. Tecnologías
D. Kimball
E. Reflexión
final
–Brett Sheppard, director de Big Data, Splunk
“2014 will be the year of the big data non-
specialist. Until recently, many big data
projects—including those built with Hadoop—
have required the skills of highly trained data
scientists. They’ve also tended to rely on fixed
schemas and scheduled reporting that limit
the kinds of questions the system can answer.
Starting in 2014, line-of-business
employees will be able to ask and
answer their own questions using
raw, unstructured big data from
disparate sources. They won’t need to
rely on specialists to unlock the value of big
data. Inevitably, they’ll start using data to help
make decisions they previously might have
made on gut-feel alone. Decision-making will
also become a more creative process, as
employees of all kinds start asking questions
of their data to test hypotheses and explore
new approaches to old problems.”
Fuente: http://inside-bigdata.com/2013/12/09/big-data-predictions-2014/
Fuente: Read Write Web, 26 de Diciembre 2013, http://readwrite.com/2013/12/26/big-data-myths-reality
El mercado requerirá
nuevos perfiles
Resumiendo
1. Las empresas pueden
capturar más datos que
nunca.
2. La explosión del social
media y del Internet of
Things son los principales
disparadores.
Resumiendo
3. Identificar lo importante
entre tanto ruido depende
del las capacidades
intuitivas y de la apertura del
tomador de decisiones.
4. Hadoop es una herramienta
extremadamente flexible
que pocos ejecutivos
entienden.
Resumiendo
5. El cliente va cambiando. Las
gerencias de negocio son
las nuevas compradoras de
software.
6. La apuesta es a largo plazo,
pero con foco en lo diario.
Las empresas necesitan de
la prueba y el error.
Big Data es pensar en nuevos
modelos de negocio basados
en las necesidades del futuro
¡Gracias!

Más contenido relacionado

La actualidad más candente

Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
sgcuadrado
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big Results
Mundo Contact
 
Presentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA MéxicoPresentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA México
Ramón Hernández
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
lalopg
 
Mongodb
MongodbMongodb
gobierno de datos
gobierno de datosgobierno de datos
gobierno de datos
Jorge Armando Vélez Marín
 
Diapositivas olap
Diapositivas olapDiapositivas olap
Diapositivas olap
Erlin Darwin Herrera cieza
 
Linea de Tiempo Big Data
Linea de Tiempo Big DataLinea de Tiempo Big Data
Linea de Tiempo Big Data
Rolando Lopez Vindel
 
Big data
Big dataBig data
Big data
Juan Anaya
 
Turning big data into big value césar hernandez
Turning big data into big value   césar hernandezTurning big data into big value   césar hernandez
Turning big data into big value césar hernandezAMDIA-Integra
 
Introduccion big data
Introduccion  big dataIntroduccion  big data
Introduccion big data
Fabian David Palmera Cantillo
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negocios
Celestino Güemes Seoane
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
nestor
 
Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5siusma
 
Calidad de datos
Calidad de datos Calidad de datos
Calidad de datos
Software Guru
 
Que es big data
Que es big dataQue es big data
Que es big data
Sergio Sanchez
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
Stratebi
 
Patrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSPatrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWS
Amazon Web Services LATAM
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdf
VernicaPaulinaChimbo
 

La actualidad más candente (20)

Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big Results
 
Presentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA MéxicoPresentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA México
 
BUSINESS INTELLIGENCE
BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
BUSINESS INTELLIGENCE
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
 
Mongodb
MongodbMongodb
Mongodb
 
gobierno de datos
gobierno de datosgobierno de datos
gobierno de datos
 
Diapositivas olap
Diapositivas olapDiapositivas olap
Diapositivas olap
 
Linea de Tiempo Big Data
Linea de Tiempo Big DataLinea de Tiempo Big Data
Linea de Tiempo Big Data
 
Big data
Big dataBig data
Big data
 
Turning big data into big value césar hernandez
Turning big data into big value   césar hernandezTurning big data into big value   césar hernandez
Turning big data into big value césar hernandez
 
Introduccion big data
Introduccion  big dataIntroduccion  big data
Introduccion big data
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negocios
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 
Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5
 
Calidad de datos
Calidad de datos Calidad de datos
Calidad de datos
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Patrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSPatrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWS
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdf
 

Destacado

Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
Stratebi
 
69 claves para conocer Big Data
69 claves para conocer Big Data69 claves para conocer Big Data
69 claves para conocer Big Data
Stratebi
 
Presentación big data Roggero
Presentación big data RoggeroPresentación big data Roggero
Presentación big data Roggero
Javier Roggero
 
Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...
Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...
Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...Quanam
 
Introducción básica a Big Data e inventario de herramientas efectivas para Bi...
Introducción básica a Big Data e inventario de herramientas efectivas para Bi...Introducción básica a Big Data e inventario de herramientas efectivas para Bi...
Introducción básica a Big Data e inventario de herramientas efectivas para Bi...
Sebastián Ramírez Montaño
 
Big Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxitoBig Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxito
Escoles Universitàries Gimbernat i Tomàs Cerdà
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
bd4s
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
Stratebi
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
EOI Escuela de Organización Industrial
 
Día solar europeo, natalia
Día solar europeo, nataliaDía solar europeo, natalia
Día solar europeo, natalia
Manuel Segura
 
Lineamientos montaje cursos bb
Lineamientos montaje cursos bbLineamientos montaje cursos bb
Lineamientos montaje cursos bbdamialex
 
Setmana cutural
Setmana cuturalSetmana cutural
Setmana cuturalJordiroig
 
Publicar contenidos en internet
Publicar contenidos en internetPublicar contenidos en internet
Publicar contenidos en internetAida March
 
B O L E T I N A R T I C U L O U N O J O R G E T O L E D O
B O L E T I N  A R T I C U L O  U N O  J O R G E  T O L E D OB O L E T I N  A R T I C U L O  U N O  J O R G E  T O L E D O
B O L E T I N A R T I C U L O U N O J O R G E T O L E D OJuan Carlos Paredes Plaza
 
Coches
CochesCoches
Coches
M Carmen Cg
 
Educar para proteger. Adolescentes.
Educar para proteger. Adolescentes.Educar para proteger. Adolescentes.
Educar para proteger. Adolescentes.Elena Rivera
 
Actividad de Aprendizaje Sesión 1
Actividad de Aprendizaje Sesión 1Actividad de Aprendizaje Sesión 1
Actividad de Aprendizaje Sesión 1
Lorena Ahumada
 

Destacado (20)

Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 
69 claves para conocer Big Data
69 claves para conocer Big Data69 claves para conocer Big Data
69 claves para conocer Big Data
 
Presentación big data Roggero
Presentación big data RoggeroPresentación big data Roggero
Presentación big data Roggero
 
Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...
Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...
Presentación Leonardo Louriero - Big Data : Mito o Realidad - Transformando e...
 
Introducción básica a Big Data e inventario de herramientas efectivas para Bi...
Introducción básica a Big Data e inventario de herramientas efectivas para Bi...Introducción básica a Big Data e inventario de herramientas efectivas para Bi...
Introducción básica a Big Data e inventario de herramientas efectivas para Bi...
 
Big Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxitoBig Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxito
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 
Día solar europeo, natalia
Día solar europeo, nataliaDía solar europeo, natalia
Día solar europeo, natalia
 
Lenergía eólica
Lenergía eólicaLenergía eólica
Lenergía eólica
 
Lineamientos montaje cursos bb
Lineamientos montaje cursos bbLineamientos montaje cursos bb
Lineamientos montaje cursos bb
 
Brujula
BrujulaBrujula
Brujula
 
Setmana cutural
Setmana cuturalSetmana cutural
Setmana cutural
 
Que importa
Que importaQue importa
Que importa
 
Publicar contenidos en internet
Publicar contenidos en internetPublicar contenidos en internet
Publicar contenidos en internet
 
B O L E T I N A R T I C U L O U N O J O R G E T O L E D O
B O L E T I N  A R T I C U L O  U N O  J O R G E  T O L E D OB O L E T I N  A R T I C U L O  U N O  J O R G E  T O L E D O
B O L E T I N A R T I C U L O U N O J O R G E T O L E D O
 
Coches
CochesCoches
Coches
 
Educar para proteger. Adolescentes.
Educar para proteger. Adolescentes.Educar para proteger. Adolescentes.
Educar para proteger. Adolescentes.
 
Actividad de Aprendizaje Sesión 1
Actividad de Aprendizaje Sesión 1Actividad de Aprendizaje Sesión 1
Actividad de Aprendizaje Sesión 1
 

Similar a Big Data

Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
Eduardo Castro
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
ICEMD
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
Eduardo Castro
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stack
Eduardo Castro
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
Eduardo Castro
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Joaquín Borrego-Díaz
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
CICE, La Escuela Profesional de Nuevas Tecnologías
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
CICE
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
JavierNavarrete43
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
Eduardo Castro
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
Eduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
Eduardo Castro
 
Qué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdfQué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdf
apssoftwaredegestion
 
Big data para la toma de decisiones en empresas de Turismo
Big data para la toma de decisiones en empresas de TurismoBig data para la toma de decisiones en empresas de Turismo
Big data para la toma de decisiones en empresas de Turismo
Edwin Arley Bernal Holguin
 
Big Data Business
Big Data BusinessBig Data Business
Big Data Business
Roberto Ponieman
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
CICE
 
Smart data el uso inteligente de los datos
Smart data el uso inteligente de los datosSmart data el uso inteligente de los datos
Smart data el uso inteligente de los datos
DataCentric PDM
 
Las dudas del Big Data, América Economía Internacional febrero 2014
Las dudas del Big Data, América Economía Internacional febrero 2014Las dudas del Big Data, América Economía Internacional febrero 2014
Las dudas del Big Data, América Economía Internacional febrero 2014
David Cornejo
 
Big Data, Big Picture
Big Data, Big PictureBig Data, Big Picture
Big Data, Big Picture
EvaluandoSoftware
 

Similar a Big Data (20)

Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stack
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Qué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdfQué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdf
 
Big data para la toma de decisiones en empresas de Turismo
Big data para la toma de decisiones en empresas de TurismoBig data para la toma de decisiones en empresas de Turismo
Big data para la toma de decisiones en empresas de Turismo
 
Big Data Business
Big Data BusinessBig Data Business
Big Data Business
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
 
Big data
Big dataBig data
Big data
 
Smart data el uso inteligente de los datos
Smart data el uso inteligente de los datosSmart data el uso inteligente de los datos
Smart data el uso inteligente de los datos
 
Las dudas del Big Data, América Economía Internacional febrero 2014
Las dudas del Big Data, América Economía Internacional febrero 2014Las dudas del Big Data, América Economía Internacional febrero 2014
Las dudas del Big Data, América Economía Internacional febrero 2014
 
Big Data, Big Picture
Big Data, Big PictureBig Data, Big Picture
Big Data, Big Picture
 

Último

Normas internacionales de informacion financiera16 Arrendamientos.pdf
Normas internacionales de informacion financiera16 Arrendamientos.pdfNormas internacionales de informacion financiera16 Arrendamientos.pdf
Normas internacionales de informacion financiera16 Arrendamientos.pdf
MaraDosil
 
SESION N° 01.pptx GESTION PROYECTOS UCV 2024
SESION N° 01.pptx GESTION PROYECTOS UCV 2024SESION N° 01.pptx GESTION PROYECTOS UCV 2024
SESION N° 01.pptx GESTION PROYECTOS UCV 2024
auyawilly
 
FINANZAS_CAJA CUSCO PROYECO DE TESIS .pptx
FINANZAS_CAJA CUSCO PROYECO DE TESIS .pptxFINANZAS_CAJA CUSCO PROYECO DE TESIS .pptx
FINANZAS_CAJA CUSCO PROYECO DE TESIS .pptx
YOLISALLOPUMAINCA
 
Diseño Organizacional e Inteligencia Artificial
Diseño Organizacional e Inteligencia ArtificialDiseño Organizacional e Inteligencia Artificial
Diseño Organizacional e Inteligencia Artificial
Israel Alcazar
 
trabajo de topicos de la industria automotriz
trabajo de topicos de la industria automotriztrabajo de topicos de la industria automotriz
trabajo de topicos de la industria automotriz
JosAlbertoLpezMartne
 
Mario Mendoza Marichal Perspectivas Empresariales para México 2024 .pdf
Mario Mendoza Marichal  Perspectivas Empresariales para México 2024 .pdfMario Mendoza Marichal  Perspectivas Empresariales para México 2024 .pdf
Mario Mendoza Marichal Perspectivas Empresariales para México 2024 .pdf
Mario Mendoza Marichal
 
MODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESA
MODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESAMODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESA
MODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESA
PETRAESPINOZASALAZAR1
 
EJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOS
EJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOSEJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOS
EJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOS
ArquitecturaClculoCe
 
CATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIA
CATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIACATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIA
CATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIA
Fernando Tellado
 
El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...
El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...
El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...
dntstartups
 
SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024
SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024
SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024
auyawilly
 
contexto macroeconomico en nicaragua en la actulidad
contexto macroeconomico en nicaragua en la actulidadcontexto macroeconomico en nicaragua en la actulidad
contexto macroeconomico en nicaragua en la actulidad
RamiroSaavedraRuiz
 
PREVENCION DELITOS RELACIONADOS COM INT.pptx
PREVENCION DELITOS RELACIONADOS COM INT.pptxPREVENCION DELITOS RELACIONADOS COM INT.pptx
PREVENCION DELITOS RELACIONADOS COM INT.pptx
johnsegura13
 
SESION 11 GESTION DE PROYECTOS EMPRESARIALES
SESION 11 GESTION DE PROYECTOS EMPRESARIALESSESION 11 GESTION DE PROYECTOS EMPRESARIALES
SESION 11 GESTION DE PROYECTOS EMPRESARIALES
Psicoterapia Holística
 
PRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptx
PRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptxPRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptx
PRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptx
BrendaRiverameneses
 
TAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffff
TAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffffTAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffff
TAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffff
GeoffreySarmiento
 
raza Berkshire.pptx razas de cerdos perú
raza Berkshire.pptx razas de cerdos perúraza Berkshire.pptx razas de cerdos perú
raza Berkshire.pptx razas de cerdos perú
huarcaojedazenayda23
 
Técnica lúdica de organización para mejorar la productividad
Técnica lúdica de organización para mejorar la productividadTécnica lúdica de organización para mejorar la productividad
Técnica lúdica de organización para mejorar la productividad
ameliaarratiale12287
 
BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.
BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.
BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.
Anna Lucia Alfaro Dardón - Ana Lucía Alfaro
 
GUIA INFORMATIVA NOM-030-STPS-2009 TECNICA
GUIA INFORMATIVA NOM-030-STPS-2009 TECNICAGUIA INFORMATIVA NOM-030-STPS-2009 TECNICA
GUIA INFORMATIVA NOM-030-STPS-2009 TECNICA
ZurielAlvarez5
 

Último (20)

Normas internacionales de informacion financiera16 Arrendamientos.pdf
Normas internacionales de informacion financiera16 Arrendamientos.pdfNormas internacionales de informacion financiera16 Arrendamientos.pdf
Normas internacionales de informacion financiera16 Arrendamientos.pdf
 
SESION N° 01.pptx GESTION PROYECTOS UCV 2024
SESION N° 01.pptx GESTION PROYECTOS UCV 2024SESION N° 01.pptx GESTION PROYECTOS UCV 2024
SESION N° 01.pptx GESTION PROYECTOS UCV 2024
 
FINANZAS_CAJA CUSCO PROYECO DE TESIS .pptx
FINANZAS_CAJA CUSCO PROYECO DE TESIS .pptxFINANZAS_CAJA CUSCO PROYECO DE TESIS .pptx
FINANZAS_CAJA CUSCO PROYECO DE TESIS .pptx
 
Diseño Organizacional e Inteligencia Artificial
Diseño Organizacional e Inteligencia ArtificialDiseño Organizacional e Inteligencia Artificial
Diseño Organizacional e Inteligencia Artificial
 
trabajo de topicos de la industria automotriz
trabajo de topicos de la industria automotriztrabajo de topicos de la industria automotriz
trabajo de topicos de la industria automotriz
 
Mario Mendoza Marichal Perspectivas Empresariales para México 2024 .pdf
Mario Mendoza Marichal  Perspectivas Empresariales para México 2024 .pdfMario Mendoza Marichal  Perspectivas Empresariales para México 2024 .pdf
Mario Mendoza Marichal Perspectivas Empresariales para México 2024 .pdf
 
MODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESA
MODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESAMODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESA
MODELO DE REGLAMENTO INTERNO DE TRABAJO DE UNA EMPRESA
 
EJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOS
EJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOSEJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOS
EJEMPLO SOLICITUD CERTIFICADO DE INFORMES PREVIOS
 
CATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIA
CATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIACATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIA
CATALOGO 2024 ABRATOOLS - ABRASIVOS Y MAQUINTARIA
 
El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...
El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...
El Pitch Deck de Facebook que Facebook utilizó para levantar su ronda de semi...
 
SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024
SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024
SESIaN N° 03.pptx GESTION PROYECTOS UCV 2024
 
contexto macroeconomico en nicaragua en la actulidad
contexto macroeconomico en nicaragua en la actulidadcontexto macroeconomico en nicaragua en la actulidad
contexto macroeconomico en nicaragua en la actulidad
 
PREVENCION DELITOS RELACIONADOS COM INT.pptx
PREVENCION DELITOS RELACIONADOS COM INT.pptxPREVENCION DELITOS RELACIONADOS COM INT.pptx
PREVENCION DELITOS RELACIONADOS COM INT.pptx
 
SESION 11 GESTION DE PROYECTOS EMPRESARIALES
SESION 11 GESTION DE PROYECTOS EMPRESARIALESSESION 11 GESTION DE PROYECTOS EMPRESARIALES
SESION 11 GESTION DE PROYECTOS EMPRESARIALES
 
PRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptx
PRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptxPRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptx
PRESUPUESTO-POR-AREAS-DE-RESPONSABILIDAD.pptx
 
TAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffff
TAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffffTAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffff
TAREA DE EPT.pptx ff4f4effffffffffffffffffffffffffffffff
 
raza Berkshire.pptx razas de cerdos perú
raza Berkshire.pptx razas de cerdos perúraza Berkshire.pptx razas de cerdos perú
raza Berkshire.pptx razas de cerdos perú
 
Técnica lúdica de organización para mejorar la productividad
Técnica lúdica de organización para mejorar la productividadTécnica lúdica de organización para mejorar la productividad
Técnica lúdica de organización para mejorar la productividad
 
BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.
BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.
BANRURAL S.A Case Study, Guatemala. INCAE Business Review, 2010.
 
GUIA INFORMATIVA NOM-030-STPS-2009 TECNICA
GUIA INFORMATIVA NOM-030-STPS-2009 TECNICAGUIA INFORMATIVA NOM-030-STPS-2009 TECNICA
GUIA INFORMATIVA NOM-030-STPS-2009 TECNICA
 

Big Data

  • 1. Big Data Valor estratégico para el mercado corporativo @ferparra
  • 2. A. Definición de Big Data B. Aplicaciones C. Tecnologías D. Mejores prácticas E. Reflexión final
  • 3. • Hacia 2020, 5,200 Gigabytes de datos serán generados para cada ser humano del planeta. • Un motor de jet en un vuelo de Londres a Nueva York genera 10 Terabytes de datos cada 30 minutos.
  • 4. • El 90% de los datos del mundo actuales fueron generados en los últimos 2 años. • Según MIT, las organizaciones grandes tienen en promedio 5.000 fuentes de datos, pero 1-2% terminan en su Data Warehouse.
  • 5. • El crecimiento exponencial se torna cada vez mas difícil de administrar. • Los datos contienen información poco obvia que las empresas podrían descubrir para mejorar sus resultados. • Las medidas de datos son relativas. Cada industria enfrenta desafíos de distinto tamaño.
  • 6. A. Definición de Big Data! B. Aplicaciones C. Tecnologías D. Mejores prácticas E. Reflexión final
  • 7. ¿Qué es Big Data? ¿Análisis Predictivo ¿Business Intelligence? ¿Data Discovery? ¿Visualizaciones e infografías?
  • 8. ¿Búsqueda de texto? ¿Procesamiento de
 eventos complejos? ¿Programación neurolingüística? ¿Aprendizaje profundo? ¿Inteligencia Artificial?
  • 9.
  • 10. ¿Cual es nuestra frontera? MB GB TB PB tabla base de datos fotos w eb audio social video m obile tiem po real casitiem po real periodico batch Velocidad Volumen Variedad
  • 11. El problema comienza a definirse como de Big Data cuando la frontera
 se expande.
  • 12. Nuestras arquitectura de información tradicional se torna inadecuada.
  • 14. Hay buenos modelos…
 y malos modelos…
  • 15. El 80% del esfuerzo se produce en la integración de datos
  • 16. La explotación de Big Data está debajo de la superficie alias
 “Dark data"
  • 17. Además, el 80% de los
 datos disponibles son
 no estructurados, pero… ¿equivalen al 80% del valor?
  • 18. ROB (Return on Byte)! Es el valor de un byte dividido por el costo de almacenarlo MAX(ROB)
  • 20. Big Data es la frontera de una firma para almacenar, procesar y acceder a todos los datos que necesita para operar eficazmente, tomar decisiones, reducir riesgos y servir a los clientes.
  • 21. A. Definición de Big Data B. Aplicaciones! C. Tecnologías D. Mejores Prácticas E. Reflexión final
  • 23. Banca Bienes de Consumo IT Telcos y comunicaciones Servicio al consumidor Análisis sentimental Seguridad informática Churn Riesgo
 crediticio Recomendación de productos Escabilidad de Infraestructura Gestión de promociones Detección de Transacciones fraudulentas Predicción de demanda en tiempo real Optimización de protocolos Alocación inteligente de capacidad Upsell y cross-sell de productos Vista 360 del consumidor Predicción de fallos M2M
  • 24. Gobierno y ciudad Biología y Medicina Energía y utilidades Internet Predicción y prevención del delito Genómica Medidores inteligentes Asistente
 virtual Ciudad
 inteligente Registro de enfermedades Redes
 mixtas Contenido personalizado Digitalización de documentos Diagnóstico médico en la nube Predicción de la demanda Aprendizaje profundo Open
 Government “Yo” cuantificado Gestión de energía desde el consumidor Internet of
 Things
  • 25. A. Definición de Big Data B. Aplicaciones C. Tecnologías! D. Mejores prácticas E. Reflexión final
  • 26. Nuevas estructuras
 de datos para
 nuevos problemas
  • 27. No Relacional Relacional Hadoop! Horton! Cloudera! MapR! Zettaset! ! ! Hadapt! ! ! Teradata! Aster! EMC! Greeplum! IBM InfoSphere! Netezza! SAP HANA! SAP Sybase IQ! HP Vertica! Oracle! Times-ten! Infobright! ParAccel! Calpoint! VectorWise Analíticas Operativas Spark Oracle IBM DB2 SQLSrvr JustOneDB Documentos Lotus Notes InterSystems! Progress! Objectivity! Versant Marklogic! McObject CouchDB! MongoDB! RavenDB NoSQL Clave
 Valor Big Table Grafos Couchbase Riak! Redis! Membrain! Voldemort! BerkleyDB Cassandra HyperTable! HBase FlockDB! InfiniteGraph! Neo4j! AllegroGraph Datos en la nube App Engine! SimpleDB Amazon Redshift! SQL Azure! database.com Xeround! FathomDB NewSQL Sybase ASE Ingress MySQL PostgreSQL EnterpriseDB SchoonerSQL! Tokutek! Continuent! Translattice! GenieDB ScaleBase! CodeFutures! VoltDB! ScalArc! Drizzle HandlerSocket! Akiban! MySQL Cluster! Clustix!
  • 29. (C) consistencia (A) disponibilidad (P) tolerancia a particiones ¿NoSQL? Elija 2 (lo sentimos)
  • 30.
  • 31.
  • 32. Hadoop • Almacenaje y procesamiento barato y a escala. • Es la tecnología dominante para procesamiento distribuido a gran escala. Crece 60% anual a tasa compuesta. • Sin embargo su nivel de utilización se encuentra por debajo del 6% en empresas.
  • 33.
  • 34. Hadoop instala herramientas en cada nodo: • Librerías y scripts en Java • Un filesystem de alta
 disponibilidad -> HDFS • Una plataforma de gestión
 de recursos de cómputo -> YARN • Un motor de 
 extracción -> Map-Reduce
  • 35. Arquitectura básica Fuente: Rare Mile Technologies, 26 de Junio de 2012, http://blog.raremile.com/hadoop-demystified/
  • 36. MapReduce Input -> Map(..) -> Reduce(..) -> output
  • 37. Nodo 2 Nodo 3 Nodo 1 Nodo 2 Nodo 3 Nodo 1 Archivosenfilesystem Map(..) Reduce(..)input output
  • 38. Soy maestro primario… tengo una caja de lápices de color y cajas más pequeñas -> Caja de lápices Un alumno: toma lápiz, le pone etiqueta, y lo vuelca en su caja (Ejemplo: Rojo, 1) -> Otro alumno: toma caja y suma los 1s -> Lápices
 por color input Map(..) Reduce(..) output
  • 39. Map Reduce Storm! Drill! HANA
 Spark Alto volumen, alta latencia Alto volumen, baja latencia Procesamiento en batch Acceso a datos en memoria Se define proceduralmente Son queries a bases de datos columnares como HBase, Cassandra o MongoDB Es adecuado para el procesamiento total de datos Es adecuado para producir reportes ah-hoc y procesamiento en tiempo real
  • 40. • Persistencia
 Cassandra, HBase • Manipulación de datos
 Pig, Pandas • Búsqueda de texto
 Solr, Lucene Tecnologías complementarias que hay que saber obligado
  • 41. Tecnologías complementarias que hay que saber obligado • Machine Learning
 Mahout, R, SAS, MADLib • Real-time processing
 Drill, Storm, Impala • In-memory
 SAP HANA, Apache Spark
  • 42. fácil ranking de ventas por región difícil clientes que estén por dejar el servicio ultra difícil clientes que muestran insatisfacción sobre problemas aún no identificados Consulta SQL Clasificador Programación neuro linguistica
  • 43. ¿Con qué sentido sumergirnos entre tanta complejidad?
  • 44. fácil ranking de ventas por región difícil clientes que estén por dejar el servicio ultra difícil clientes que muestran insatisfacción sobre problemas aún no identificados Microstrategy Modelo en R Luminoso
  • 45. Las bases de datos columnares tienen grandes beneficios • Aprovechamiento de procesamiento masivo en paralelo (MPP). • Posibilitan el almacenamiento en memoria RAM. • Fáciles de administrar y de leer
 (viejo y conocido SQL) • Soportan un volumen del orden de los TBs sin problemas
  • 46. Analytics in-database y funciones definidas por el usuario • Ganancia cualitativa en performance. • Compatibles con lenguajes de markup para aplicaciones de Data Mining (PMML) • Contendientes: Aster Data, Vertica, Netezza, Greenplum (EMC), ParAccel, SAP Sybase
  • 47. Columnar + In-Database analytics =
  • 48. A. Definición de Big Data B. Aplicaciones C. Tecnologías D. Mejores prácticas! E. Reflexión final
  • 49.
  • 50.
  • 51. Algunas Mejores prácticas 1. Partir siempre de una hipótesis antes de actuar sobre los datos 2. No construir Legacy 3. Definir una “autopista de la información” 4. Seguir pensando en dimensiones e indicadores
  • 52. Algunas Mejores prácticas 5. Construir una infraestructura flexible y escalable (la nube) 6. Implementar flujos conectados a las etapas de caché anteriores 7. Los datos mas próximos van a ser sucios, pero debe agregarse valor en la etapas subsiguientes
  • 53. A. Definición de Big Data B. Aplicaciones C. Tecnologías D. Kimball E. Reflexión final
  • 54.
  • 55. –Brett Sheppard, director de Big Data, Splunk “2014 will be the year of the big data non- specialist. Until recently, many big data projects—including those built with Hadoop— have required the skills of highly trained data scientists. They’ve also tended to rely on fixed schemas and scheduled reporting that limit the kinds of questions the system can answer. Starting in 2014, line-of-business employees will be able to ask and answer their own questions using raw, unstructured big data from disparate sources. They won’t need to rely on specialists to unlock the value of big data. Inevitably, they’ll start using data to help make decisions they previously might have made on gut-feel alone. Decision-making will also become a more creative process, as employees of all kinds start asking questions of their data to test hypotheses and explore new approaches to old problems.” Fuente: http://inside-bigdata.com/2013/12/09/big-data-predictions-2014/
  • 56. Fuente: Read Write Web, 26 de Diciembre 2013, http://readwrite.com/2013/12/26/big-data-myths-reality
  • 58. Resumiendo 1. Las empresas pueden capturar más datos que nunca. 2. La explosión del social media y del Internet of Things son los principales disparadores.
  • 59. Resumiendo 3. Identificar lo importante entre tanto ruido depende del las capacidades intuitivas y de la apertura del tomador de decisiones. 4. Hadoop es una herramienta extremadamente flexible que pocos ejecutivos entienden.
  • 60. Resumiendo 5. El cliente va cambiando. Las gerencias de negocio son las nuevas compradoras de software. 6. La apuesta es a largo plazo, pero con foco en lo diario. Las empresas necesitan de la prueba y el error.
  • 61. Big Data es pensar en nuevos modelos de negocio basados en las necesidades del futuro