SlideShare una empresa de Scribd logo
1 de 110
Desmitificando Big Data:
Data Mining y Business Intelligence 2.0
Fecha presentación: 14 de Noviembre de 2014
Desmitificando Big Data:
Data Mining y Business Intelligence 2.0
Big Data como persona
2014
¿Qué es BigData?
Este concepto hace referencia a la acumulación masiva de datos.
Otras denominaciones son datos masivos o datos a gran escala. En la
literatura escrita en lengua hispana con frecuencia se utiliza el término
en inglés Big data , como aparece en el ensayo de Viktor
Schönberger Big data: La revolución de los datos masivos
Wikipedia.org
Barreras tecnológicas
en el procesamiento de grandes problemas
Supercomputador ALTAMIRA
Commodity Hardware
=
Low Cost
=
Uso masivo
Historia de tecnologías
TECNOLOGÍAS
20142004
Apache KAFKA
TECNOLOGÍAS
20142004 2010 201120092007
CRONOGRAMA BIG DATA
2004
Un poco de historia…
Las primeras implementaciones de Google
necesitaban realizar operaciones de
multplicación de grandes matrices para
calcular el PageRank
La preocupación por tratar grandes colecciones de datos,
llevó a crear algoritmos y frameworks capaces de poder
procesar terabytes de información
Una de las primeras aplicaciones
capaces de programar MapReduce
fue implementado inicialmente en,
diseñado inicialmente por Doug
Cutting
DISTRIBUCION MAP REDUCE
Y en 2004 no había datos?
Y los bancos? Y las ventas de supermercados?
10
http://www.nytimes.com/2004/11/14/business/yourmoney/14wal.html?_r=1&
http://www.nytimes.com/2004/11/14/business/yourmoney/14wal.html?_r=1&
Algo raro?
No. Data Mining
Un proceso no trivial de identificación válida, novedosa, potencialmente útil y
entendible de patrones comprensibles que se encuentran ocultos en los datos
(Fayyad y otros, 1996)
From Data Mining to Knowledge Discovery in Databases
1996
DATA MINING
La minería de datos o exploración de datos (es la etapa de análisis de
"Knowledge Discovery in Databases" o KDD) es un campo de las ciencias de
la computación referido al proceso que intenta descubrir patrones en
grandes volúmenes de conjuntos de datos.
Las técnicas de la minería de datos provienen de la inteligencia artificial y de la
estadística, dichas técnicas, no son más que algoritmos, más o menos
sofisticados que se aplican sobre un conjunto de datos para obtener unos
resultados.
Wikipedia.org
Fue desarrollado inicialmente por Robert
Gentleman y Ross Ihaka del Departamento de
Estadística de la Universidad de Auckland en
1993.
En 1993, la Universidad de Waikato de Nueva
Zelanda inició el desarrollo de la versión original
de Weka (en TCL/TK y C)
1993
Problema
Single node.
Y la distribución de algoritmos?
Nuevas Propuestas en BigData: DataMining 2.0
Nuevas Propuestas en BigData: DataMining 2.0
http://hortonworks.com/hadoop-tutorial/using-
rhadoop-to-predict-visitors-amount/
Nuevas Propuestas en BigData: DataMining 2.0
http://hortonworks.com/hadoop-
tutorial/using-rhadoop-to-predict-
visitors-amount/
Nuevas Propuestas en BigData: DataMining 2.0
Nuevas Propuestas en BigData: DataMining 2.0
Nuevas Propuestas en BigData: DataMining 2.0
Nuevas Propuestas en BigData: DataMining 2.0
DATA MINING
Algo más que el presente
Y LA FOTO ACTUAL?
BUSINESS INTELLIGENCE
In 1989, Howard Dresner expanded on the popular umbrella term
"Business Intelligence (BI)", originally coined by Hans Peter Luhn in
1958. Dresner defined it to mean "concepts and methods to improve
business decision making by using fact-based support systems". Not
long after, in response to the need for better BI, companies such as
Business Objects, Actuate, Crystal Reports, and MicroStrategy began to
emerge, offering to report and analyze company data. Source: A Brief
History of Decision Support Systems by D.J. Power.
1989
Conceptos y métodos para mejorar la toma de decisiones basadas en hechos
BUSINESS INTELLIGENCE
Solución BI completa permite:
Observar: ¿qué está ocurriendo?
Comprender: ¿por qué ocurre?
Predecir: ¿qué ocurriría?
Colaborar. ¿qué debería hacer el equipo?
Decidir: ¿qué camino se debe conseguir?
Gestión del conocimiento
¿Qué es lo que la empresa está buscando?
Business Intelligence es la
habilidad para transformar
los datos en información, y la
información en
conocimiento, de forma que
se pueda optimizar el
proceso de toma de
decisiones en los negocios
Un conjunto de prácticas tecnológicas, herramientas
informáticas y conocimientos funcionales aplicados al
negocio, que permiten estructurar el acceso a la
información, y la información misma, para que sea
utilizada en la toma de decisiones en cualquier nivel de
una organización
Herramientas por doquier
Herramientas por doquier
Vendedores de
humo
20
Big Data y Business Intelligence
Herramientas BI buscan actualizarse
Creación de nuevos conectores:
Manipulación de datos
Visualización de datos
El primero que lo tenga es el que tiene éxito
Pentaho Data Integration
Talend Open Studio
Los retos de las tecnologías tradicionales
y las propuestas Big Data para
procesamiento de datos
RETO 1: Almacenamiento.
¿DBs Relacionales para todo?
Leer datos es costoso
¿Realmente necesitamos transacciones para todo?
¿Cómo escalamos?
¿Todo dominio se representa bien en un modelo relacional?
Como respuesta a estos problemas surgió el paradigma
NoSQL
NoSQL no es un sustituto a las bases de datos relacionales
busca otras opciones para escenarios específicos
Es solo una forma de decir que no todos los problemas son
clavos que pueden ser atacados con un RDBMS
El desarrollador cuenta con un abanico de soluciones y
puede elegir la mejor para su problema en específico
Existen varias formas de NoSQL, que atacan los problema del
escalamiento, performance y modelado de los datos de
formas distintas.
Not Only SQL (NoSQL)
Tipos de BD Big Data. Not Only SQL (NoSQL)
Almacenes Key-ValueBases de datos
orientadas
a documentos
Bases de datos
orientadas a grafos
Bases de datos
orientadas a objetos
No sustituyen al modelo relacional. Escenarios específicos.
Más simples en cuanto su uso
VALOR guardado se
almacena como un arreglo de
bytes (BLOB)
El tipo de contenido no es
importante para la base de
datos, solo la clave y el valor
que tiene asociado
No necesita definir un
esquema (columnas, tipos de
datos) para almacenar la
información.
Escalabilidad: de key X a X+100 en Server 1, de X+101 a X+200 a
Server2
DBs Clave-Valor
Un almacen key-value con la excepción de que el valor no se
guarda sólo como un campo binario, sino con un formato
definido de forma tal que el servidor pueda entender
la diferencia es que el campo binario puede ser entendido
por la base de datos
DBs orientadas a documentos
Se basan en el paradigma orientado a
objetos y no en el modelo relacional
No se basan en claves primarias sino en
OID
Pueden representar relaciones
jerárquicas
Las relaciones entre tablas son a través
de punteros a objetos
Las bases orientadas a objetos nunca tuvieron el impacto
esperado, pero tienen varios nichos específicos como algunas
aplicaciones de carácter científico
DBs orientadas a objetos
DBs orientadas a grafos
Almacenan los datos en forma de
grafo.
Da importancia no solo a los datos,
sino a las relaciones entre ellos
Más eficiente navegar entre
relaciones que en un modelo
relacional
Sólo son aprovechables si tu
información se puede representar
fácilmente como una red
30
20142004 2010 201120092007
RETO 2: Procesamiento
¿Cómo procesamos la cantidad ingente de datos?
Supercomputador vs Cluster con commodity hardware
Las primeras implementaciones de Google necesitaban
realizar operaciones de multplicación de grandes matrices
para calcular el PageRank
La preocupación por tratar grandes colecciones de datos,
llevó a crear algoritmos y frameworks capaces de poder
procesar terabytes de información con commodity HW
Una de las primeras aplicaciones
capaces de programar MapReduce
fue implementado inicialmente en
Hadoop, diseñado inicialmente por
Doug Cutting
Divide y vencerás
Programación Java
Operaciones en disco (HD)
Y la memoria?
DB COLUMN
El viejo que revive
VS
RETO 3: Real Time
¿Antes existía?
Real Time: Procesamiento
Real Time: Flujos y colas
Nuevos modelos de negocio
Fomento distribución de datos: APIficación
Fomento de enriquecimiento de soluciones analíticas
Impulso al Cloud
Puntos geoposicionados www.factual.com
Menciones de marcas www.explorabrand.com
Infraestructura Cloud y otros servicios
GRAN BENEFICIADO: OPEN SOURCE
NUEVOS EQUIPOS: DATA SCIENTIST
Big Data , Data Mining, Business Intelligence…
Búsquedas en la web
Apariciones en noticias
Data Analytics vs Big Data
Búsquedas en la web
Apariciones en noticias
En Resumen…
El procesamiento masivo de datos no es nuevo
Diferentes planteamientos en resolución de problemas
Nuevas propuestas tecnológicas. Evolución creciente
Actualización de herramientas
Fomento del Open Source
Fomento del analytics
Nuevas oportunidades de negocio
Nuevas demandas en el sector (Data Scientist = todoterreno)
Data Mining y Business Intelligence 2.0
Business Analytics y Data Mining son los
procedimientos.
Big Data es la tecnología.
Desmitificando el Big Data
Desmitificando el Big Data

Más contenido relacionado

La actualidad más candente

Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesStratebi
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsMundo Contact
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes socialesDatKnoSys
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivassgcuadrado
 
Cómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónCómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónBEEVA_es
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosCelestino Güemes Seoane
 
Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpGrupo DIRCOM
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesJuan José Domenech
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big DataDavid Alayón
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno BancarioMartín Cabrera
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales.. ..
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 

La actualidad más candente (20)

Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big Results
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Big Data
Big DataBig Data
Big Data
 
Big Data & RRHH
Big Data & RRHHBig Data & RRHH
Big Data & RRHH
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Cómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónCómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organización
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negocios
 
Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Anatomía de un proyecto de Big Data
Anatomía de un proyecto de Big DataAnatomía de un proyecto de Big Data
Anatomía de un proyecto de Big Data
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno Bancario
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 

Destacado

Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgSnoop Consulting
 
Caso de usos mineria
Caso de usos mineriaCaso de usos mineria
Caso de usos mineriaSeerr Kstro
 
Data mining
Data miningData mining
Data miningmayimez
 
Data Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenData Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenSoftware Guru
 
Introduccion a Machine Learning
Introduccion a Machine LearningIntroduccion a Machine Learning
Introduccion a Machine LearningStratebi
 
Más de 7 razones para no emprender y Menos de 7 emociones para hacerlo
Más de 7 razones para no emprender y Menos de 7 emociones para hacerloMás de 7 razones para no emprender y Menos de 7 emociones para hacerlo
Más de 7 razones para no emprender y Menos de 7 emociones para hacerloJorge Garcia del Arco
 
Presentación XX Foro Universitario Juan Luis Vives. Miguel Valldecabres
Presentación XX Foro Universitario Juan Luis Vives. Miguel ValldecabresPresentación XX Foro Universitario Juan Luis Vives. Miguel Valldecabres
Presentación XX Foro Universitario Juan Luis Vives. Miguel ValldecabresForoJuanLuisVives
 
Espiritu Emprendedor
Espiritu EmprendedorEspiritu Emprendedor
Espiritu EmprendedorCecy Mendez
 
Introducción a Text Mining
Introducción a Text MiningIntroducción a Text Mining
Introducción a Text MiningJuan Azcurra
 
Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...
Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...
Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...Luis Fernando Heras Portillo
 
La aventura de emprender
La aventura de emprenderLa aventura de emprender
La aventura de emprenderFormazion
 
Big Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datosBig Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datosLuis Joyanes
 
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.DMC Perú
 

Destacado (20)

Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
Caso de usos mineria
Caso de usos mineriaCaso de usos mineria
Caso de usos mineria
 
Data Mining en Forman
Data Mining en FormanData Mining en Forman
Data Mining en Forman
 
Data Mining
Data MiningData Mining
Data Mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenData Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesen
 
Introduccion a Machine Learning
Introduccion a Machine LearningIntroduccion a Machine Learning
Introduccion a Machine Learning
 
Presentación motivación
Presentación motivaciónPresentación motivación
Presentación motivación
 
Más de 7 razones para no emprender y Menos de 7 emociones para hacerlo
Más de 7 razones para no emprender y Menos de 7 emociones para hacerloMás de 7 razones para no emprender y Menos de 7 emociones para hacerlo
Más de 7 razones para no emprender y Menos de 7 emociones para hacerlo
 
Presentación XX Foro Universitario Juan Luis Vives. Miguel Valldecabres
Presentación XX Foro Universitario Juan Luis Vives. Miguel ValldecabresPresentación XX Foro Universitario Juan Luis Vives. Miguel Valldecabres
Presentación XX Foro Universitario Juan Luis Vives. Miguel Valldecabres
 
Razón para emprender
Razón para emprenderRazón para emprender
Razón para emprender
 
Espiritu Emprendedor
Espiritu EmprendedorEspiritu Emprendedor
Espiritu Emprendedor
 
Introducción a Text Mining
Introducción a Text MiningIntroducción a Text Mining
Introducción a Text Mining
 
La aventura de emprender
La aventura de emprenderLa aventura de emprender
La aventura de emprender
 
Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...
Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...
Guia del Emprendedor: De la idea a la Empresa rescatado por Luis Fernando Her...
 
La aventura de emprender
La aventura de emprenderLa aventura de emprender
La aventura de emprender
 
Big Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datosBig Data. La revolución y el poder de los datos
Big Data. La revolución y el poder de los datos
 
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
 

Similar a Desmitificando el Big Data

Cursos Big Data Open Source
Cursos Big Data Open SourceCursos Big Data Open Source
Cursos Big Data Open SourceStratebi
 
Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"Javier Peña
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...CICE
 
Jornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataJornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataUrko Zurutuza
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Gabriel Eisbruch
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleoCICE
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
 
Revista TicNews Edición Junio 2014
Revista TicNews Edición Junio 2014Revista TicNews Edición Junio 2014
Revista TicNews Edición Junio 2014Edicion Ticnews
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningStratebi
 
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABBig data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABOutliers Collective
 

Similar a Desmitificando el Big Data (20)

Big data
Big dataBig data
Big data
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
Cursos Big Data Open Source
Cursos Big Data Open SourceCursos Big Data Open Source
Cursos Big Data Open Source
 
Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
BigData
BigDataBigData
BigData
 
Jornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataJornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big Data
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Revista TicNews Edición Junio 2014
Revista TicNews Edición Junio 2014Revista TicNews Edición Junio 2014
Revista TicNews Edición Junio 2014
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine Learning
 
Claves para entender el actual big data
Claves para entender el actual big dataClaves para entender el actual big data
Claves para entender el actual big data
 
Qué es big data
Qué es big dataQué es big data
Qué es big data
 
Bases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y GeneralidadesBases de Datos: Conceptos y Generalidades
Bases de Datos: Conceptos y Generalidades
 
Cbs big data-fundamentals-1
Cbs big data-fundamentals-1Cbs big data-fundamentals-1
Cbs big data-fundamentals-1
 
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABBig data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
 

Más de Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 

Más de Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 

Último

Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiatongailustraconcienc
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptxKatherineFabianLoza1
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docxmarthaarroyo16
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotessald071205mmcnrna9
 
FORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOFORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOsecundariatecnica891
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405rodrimarxim
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOReluniversocom
 
stellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino morastellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino moraYessicaBrigithArdila
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdfCamilaArzate2
 
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILPREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILeluniversocom
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxYoladsCabarcasTous
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfhernestosoto82
 
Mapa de riesgos de un cine, equipo 4.pdf
Mapa de riesgos de un cine, equipo 4.pdfMapa de riesgos de un cine, equipo 4.pdf
Mapa de riesgos de un cine, equipo 4.pdfhees071224mmcrpna1
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Ivie
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024eluniversocom
 

Último (20)

Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologia
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotes
 
FORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOFORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASO
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
 
stellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino morastellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino mora
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
 
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILPREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptx
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdf
 
Mapa de riesgos de un cine, equipo 4.pdf
Mapa de riesgos de un cine, equipo 4.pdfMapa de riesgos de un cine, equipo 4.pdf
Mapa de riesgos de un cine, equipo 4.pdf
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
 

Desmitificando el Big Data

  • 1. Desmitificando Big Data: Data Mining y Business Intelligence 2.0 Fecha presentación: 14 de Noviembre de 2014
  • 2.
  • 3. Desmitificando Big Data: Data Mining y Business Intelligence 2.0
  • 4.
  • 5. Big Data como persona 2014
  • 6.
  • 7.
  • 8.
  • 10. Este concepto hace referencia a la acumulación masiva de datos. Otras denominaciones son datos masivos o datos a gran escala. En la literatura escrita en lengua hispana con frecuencia se utiliza el término en inglés Big data , como aparece en el ensayo de Viktor Schönberger Big data: La revolución de los datos masivos Wikipedia.org
  • 11.
  • 12. Barreras tecnológicas en el procesamiento de grandes problemas
  • 14.
  • 19.
  • 21. Un poco de historia… Las primeras implementaciones de Google necesitaban realizar operaciones de multplicación de grandes matrices para calcular el PageRank La preocupación por tratar grandes colecciones de datos, llevó a crear algoritmos y frameworks capaces de poder procesar terabytes de información Una de las primeras aplicaciones capaces de programar MapReduce fue implementado inicialmente en, diseñado inicialmente por Doug Cutting
  • 23. Y en 2004 no había datos? Y los bancos? Y las ventas de supermercados? 10
  • 27. Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos (Fayyad y otros, 1996) From Data Mining to Knowledge Discovery in Databases 1996
  • 28. DATA MINING La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Las técnicas de la minería de datos provienen de la inteligencia artificial y de la estadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. Wikipedia.org
  • 29. Fue desarrollado inicialmente por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993. En 1993, la Universidad de Waikato de Nueva Zelanda inició el desarrollo de la versión original de Weka (en TCL/TK y C) 1993
  • 30.
  • 31. Problema Single node. Y la distribución de algoritmos?
  • 32. Nuevas Propuestas en BigData: DataMining 2.0
  • 33. Nuevas Propuestas en BigData: DataMining 2.0 http://hortonworks.com/hadoop-tutorial/using- rhadoop-to-predict-visitors-amount/
  • 34. Nuevas Propuestas en BigData: DataMining 2.0 http://hortonworks.com/hadoop- tutorial/using-rhadoop-to-predict- visitors-amount/
  • 35. Nuevas Propuestas en BigData: DataMining 2.0
  • 36. Nuevas Propuestas en BigData: DataMining 2.0
  • 37. Nuevas Propuestas en BigData: DataMining 2.0
  • 38. Nuevas Propuestas en BigData: DataMining 2.0
  • 39. DATA MINING Algo más que el presente Y LA FOTO ACTUAL? BUSINESS INTELLIGENCE
  • 40. In 1989, Howard Dresner expanded on the popular umbrella term "Business Intelligence (BI)", originally coined by Hans Peter Luhn in 1958. Dresner defined it to mean "concepts and methods to improve business decision making by using fact-based support systems". Not long after, in response to the need for better BI, companies such as Business Objects, Actuate, Crystal Reports, and MicroStrategy began to emerge, offering to report and analyze company data. Source: A Brief History of Decision Support Systems by D.J. Power. 1989 Conceptos y métodos para mejorar la toma de decisiones basadas en hechos
  • 42.
  • 43. Solución BI completa permite: Observar: ¿qué está ocurriendo? Comprender: ¿por qué ocurre? Predecir: ¿qué ocurriría? Colaborar. ¿qué debería hacer el equipo? Decidir: ¿qué camino se debe conseguir? Gestión del conocimiento ¿Qué es lo que la empresa está buscando? Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios
  • 44. Un conjunto de prácticas tecnológicas, herramientas informáticas y conocimientos funcionales aplicados al negocio, que permiten estructurar el acceso a la información, y la información misma, para que sea utilizada en la toma de decisiones en cualquier nivel de una organización
  • 48.
  • 49.
  • 50. Big Data y Business Intelligence
  • 51.
  • 52.
  • 53. Herramientas BI buscan actualizarse Creación de nuevos conectores: Manipulación de datos Visualización de datos El primero que lo tenga es el que tiene éxito
  • 54.
  • 57. Los retos de las tecnologías tradicionales y las propuestas Big Data para procesamiento de datos
  • 58. RETO 1: Almacenamiento. ¿DBs Relacionales para todo?
  • 59. Leer datos es costoso ¿Realmente necesitamos transacciones para todo? ¿Cómo escalamos? ¿Todo dominio se representa bien en un modelo relacional?
  • 60. Como respuesta a estos problemas surgió el paradigma NoSQL NoSQL no es un sustituto a las bases de datos relacionales busca otras opciones para escenarios específicos Es solo una forma de decir que no todos los problemas son clavos que pueden ser atacados con un RDBMS El desarrollador cuenta con un abanico de soluciones y puede elegir la mejor para su problema en específico Existen varias formas de NoSQL, que atacan los problema del escalamiento, performance y modelado de los datos de formas distintas. Not Only SQL (NoSQL)
  • 61. Tipos de BD Big Data. Not Only SQL (NoSQL) Almacenes Key-ValueBases de datos orientadas a documentos Bases de datos orientadas a grafos Bases de datos orientadas a objetos No sustituyen al modelo relacional. Escenarios específicos.
  • 62. Más simples en cuanto su uso VALOR guardado se almacena como un arreglo de bytes (BLOB) El tipo de contenido no es importante para la base de datos, solo la clave y el valor que tiene asociado No necesita definir un esquema (columnas, tipos de datos) para almacenar la información. Escalabilidad: de key X a X+100 en Server 1, de X+101 a X+200 a Server2 DBs Clave-Valor
  • 63. Un almacen key-value con la excepción de que el valor no se guarda sólo como un campo binario, sino con un formato definido de forma tal que el servidor pueda entender la diferencia es que el campo binario puede ser entendido por la base de datos DBs orientadas a documentos
  • 64. Se basan en el paradigma orientado a objetos y no en el modelo relacional No se basan en claves primarias sino en OID Pueden representar relaciones jerárquicas Las relaciones entre tablas son a través de punteros a objetos Las bases orientadas a objetos nunca tuvieron el impacto esperado, pero tienen varios nichos específicos como algunas aplicaciones de carácter científico DBs orientadas a objetos
  • 65. DBs orientadas a grafos Almacenan los datos en forma de grafo. Da importancia no solo a los datos, sino a las relaciones entre ellos Más eficiente navegar entre relaciones que en un modelo relacional Sólo son aprovechables si tu información se puede representar fácilmente como una red 30
  • 67. RETO 2: Procesamiento ¿Cómo procesamos la cantidad ingente de datos?
  • 68. Supercomputador vs Cluster con commodity hardware
  • 69.
  • 70.
  • 71. Las primeras implementaciones de Google necesitaban realizar operaciones de multplicación de grandes matrices para calcular el PageRank La preocupación por tratar grandes colecciones de datos, llevó a crear algoritmos y frameworks capaces de poder procesar terabytes de información con commodity HW Una de las primeras aplicaciones capaces de programar MapReduce fue implementado inicialmente en Hadoop, diseñado inicialmente por Doug Cutting
  • 72.
  • 74.
  • 76.
  • 77. Operaciones en disco (HD) Y la memoria?
  • 78.
  • 79.
  • 80. DB COLUMN El viejo que revive
  • 81. VS
  • 82.
  • 83. RETO 3: Real Time ¿Antes existía?
  • 85.
  • 86. Real Time: Flujos y colas
  • 87.
  • 88.
  • 89. Nuevos modelos de negocio Fomento distribución de datos: APIficación Fomento de enriquecimiento de soluciones analíticas Impulso al Cloud
  • 91. Menciones de marcas www.explorabrand.com
  • 92. Infraestructura Cloud y otros servicios
  • 93.
  • 94.
  • 96.
  • 97. NUEVOS EQUIPOS: DATA SCIENTIST
  • 98.
  • 99.
  • 100. Big Data , Data Mining, Business Intelligence…
  • 103. Data Analytics vs Big Data
  • 107. El procesamiento masivo de datos no es nuevo Diferentes planteamientos en resolución de problemas Nuevas propuestas tecnológicas. Evolución creciente Actualización de herramientas Fomento del Open Source Fomento del analytics Nuevas oportunidades de negocio Nuevas demandas en el sector (Data Scientist = todoterreno) Data Mining y Business Intelligence 2.0
  • 108. Business Analytics y Data Mining son los procedimientos. Big Data es la tecnología.