SlideShare una empresa de Scribd logo
1 de 49
desmitificando
BIG DATA
•Qué es Big Data
•Por qué surge
•Para qué sirve
•El Factor Visualización
•Conclusiones
DataWarehouse
BIG DATA
Data Mining
Business Intelligence
QMF
ETL
BIG DATA
Web 2.0
Efecto:2000
.COM
DataWarehouse
Data Mining
Business Intelligence
Herramientas CASE
OrientaciónaObjetos
Downsizing
RAD
Web 2.0
Efecto:2000
.COM
DataWarehouse
Data Mining
Business Intelligence
Cliente/Servidor
Centro de Información
Linux vs Windows
Windows vs OS/2
BIG DATA
Rightsizing
OS/2 vs MS/DOS
Unix vs Mainframe
Relacional vs Jerárquica
ArquitecturaSAA
Mcvseverything
Programación Estructurada
Teleproceso
OnLine
XML
Entidad/Relación
Data Mar
Metodología
B.Datos Relacional
Method/1
B.DatosJerárquica
MainframeCodigospaghetti
Herramientas CASE
OrientaciónaObjetos
Downsizing
RAD
Web 2.0
Efecto:2000
.COM
DataWarehouse
Data Mining
Business Intelligence
Cliente/Servidor
Centro de Información
Linux vs Windows
Windows vs OS/2
BIG DATA
Rightsizing
OS/2 vs MS/DOS
Unix vs Mainframe
Relacional vs Jerárquica
ArquitecturaSAA
Mcvseverything
Programación Estructurada
Teleproceso
OnLine
XML
Entidad/Relación
Data Mar
Metodología
B.Datos Relacional
Method/1
B.DatosJerárquica
MainframeCodigospaghetti
“Internet of Thing
Próximamente en sus pantallas:
“El futuro descansa en diseñar y
vender computadoras que la gente
no se de cuenta que son
computadoras”
Adam Osborne, 1983
“La mejor manera de predecir el futuro
es inventarlo”
Peter F. Drucker
“640 K deberían ser suficientes para
cualquiera”
Bill Gates, 1981
Doug Laney:
Big data son activos de información de gran volumen,
alta velocidad de crecimiento y gran variedad de
formatos, que exigen formas innovadoras de proceso de
información, para una mejor comprensión y toma de
decisiones.
[Otras definiciones/reflexiones menos formales]
“Big Data es como el sexo adolescente:
todos hablan de él, nadie sabe realmente cómo hacerlo y
todos piensan que los demás lo hacen...”
Frase atribuída a Dan Ariely
“Palabra Técnica de moda que todo el mundo usa y nadie
entiende muy bien”
http://www.languagemonitor.com
“Big Data: hemos pasado de no saber qué es, a que todo
el mundo proclame que tiene uno, sin que en el intermedio
haya ocurrido nada relevante…”
Javier Valdés - Logtrust
Siempre hay quien lo confunde con sus herramientas…
También hay quien lo identifica con:
Big Data te vigila…
También se dice:
Big Data is dead…
Según Gartner, el término ha llegado al “Máximo de
inflacción de expectativas”
Tendemos a sobrevalorar el impacto de la tecnología en
el corto plazo….
y a infravalorarlo en el largo.
“Se abusa del término Big Data y sus famosas 3 V.
Ya hay quien lo detesta y considera que su simple
aparición en una conversación o texto es síntoma de
falta de rigor…”
“Big Data es una de los escasos ejemplos de
tecnologías que se definen por ‘el problema’ y no por
‘la solución’. Esa es una de las razones del abuso de
tópicos y conceptos sin verdadero significado real.”
y sin embargo…
Los hechos…
Nuevo término:
Datification
Nuevo término:
Datification
El crecimiento de
Internet
27.483 PB/mes
Si se almacenaran en DVD estándar y se pusieran juntos, medirían la distancia
de la Luna a la Tierra… ida y vuelta.
http://www.evolutionoftheweb.com/
Repasando…Kilobyte (KB)
10
3
megabyte (MB)
10
6
gigabyte (GB)
10
9
terabyte (TB)
10
12
petabyte (PB)
10
15
exabyte (EB)
10
18
zettabyte (ZB)
10
21
yottabyte (YB)
10
24
• Google procesa sobre 20 petabytes de datos cada día
•Filmar 100 años de vida de una persona en alta definición (10
megapíxels, 50 fotogramas por segundo) ocuparía 0,5 petabytes.
•Facebook tiene 60 mil millones de imágenes, lo que supone 1,5
petabytes de almacenamiento y crece a un ritmo de 220 millones de
imágenes por semana.
Espectacular caída de costes de almacenamiento…
…entramos en la Era Petabyte
Datos no estructurados, no catalogados y sin explorar
que se encuentran en los repositorios de datos y que aún
no han sido analizados ni procesados.
Nuevo término:
Dark Data
Datos
conocidos
Datos desconocidos,
se sabe que existen
Datos desconocidos,
No se sabe que existen
Big
Data
Factores relevantes:
La información no operativa (Dark Data)
podría ayudar a tomar decisiones.
Poder tomar decisiones antes que los demás
es una verdadera ventaja competitiva .
•Integrar no solo información operativa
•Guardar terabytes de información por día
•Hacer consultas sobre ellos
•Correlaciones
•Hacerlo todo en tiempo real
•Y disponer de esta información de forma
permanente y longeva
¿ Cómo lo absorbemos?
Por lo tanto necesitaríamos:
Asimilación de la información
El número de conceptos simultáneos que
podemos asimilar, oscila entre 5 y 9.
( 7+- 2 )
George A. Miller
¿ Cuanto hace que se
rebasó el límite ?
Pero no toda la información se
procesa de la misma manera…
Hay modalidades que se
asimilan de forma directa,
prácticamente sin necesidad de
reflexión
Visualiza
ción
Ejemplo de Visualización:
•Aparecerá una lista de 7 palabras (dentro de
los límites de Miller)
•El objetivo es intentar recordarlas después de
verlas unos segundosDesperta
dor
Camisa
Piano
Casa
Sofa
Toro
Besugo¿ Resultados ?
…variables, pero en el mejor de los casos, se nos
olvidarán en pocos minutos. Probemos de forma
visual:
Ejemplo de Visualización:
Localizar los “7” de esta figura
Ejemplo de Visualización:
Representar patrones de correlación
En realidad el poder de “lo visual” es algo que
conocemos desde hace mucho tiempo…
Primer gráfico estadístico conocido:
1644 Michael Florent van Langren,
cartógrafo Holandés que proponía un sistema
de cálculo de la Longitud.
Representación gráfica de la disparidad de valores propuestos para la
Longitud entre Toledo y Roma
…mejorando el gráfico con medios modernos:
William Playfair 1759-1923 – Ingeniero y economista político Escocés, fundador del
Método Gráfico Estadístico
La Visualización no sólo representa de forma
rápida y concisa la información…
También permite DESCUBRIRLA
Mapa del DR.
Snow, 1814
Epidemia de cólera,
localización de fuente de
agua contaminada
Doug Laney:
Big data son activos de información de gran volumen,
alta velocidad de crecimiento y gran variedad de
formatos, que exigen
formas innovadoras de proceso de información
para una mejor comprensión
y toma de decisiones
IT Convencional
¿ Big Data ó Collatera
IT Convencional
?
1- ¿ Pregunta ?
2- Actividad
3- Obtener Datos
y Almacenarlos
4- Ordenación y
Estructuración
5- Exploración
5’-Automatismos
de Análisis
6- Visualización y
Comunicación
Ejemplos varios de Visualización Logtrust:
En Resumen:
•Big Data es una Moda
•Big Data no sólo es un acierto
de Marketing
•Big Data es una Necesidad
•Big Data es un Hecho
•Big Data es Accesible
Muchas
gracias
Javier Valdés Quirós
COO
javier.valdes@logtrust.com

Más contenido relacionado

Similar a Desmitificando BIG DATA: qué es, por qué surge y para qué sirve

2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigDataKEEDIO
 
Primeros pasos con Neo4j
Primeros pasos con Neo4jPrimeros pasos con Neo4j
Primeros pasos con Neo4jUbaldo Taladriz
 
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABBig data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABOutliers Collective
 
El Internet de las Cosas y las Personas con Internet
El Internet de las Cosas y las Personas con InternetEl Internet de las Cosas y las Personas con Internet
El Internet de las Cosas y las Personas con InternetWilly Marroquin (WillyDevNET)
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 
Diaspositivas de la tecnologia
Diaspositivas de la tecnologiaDiaspositivas de la tecnologia
Diaspositivas de la tecnologiaMejoresBrujas_123
 
vision general base de datos.pdf
vision general base de datos.pdfvision general base de datos.pdf
vision general base de datos.pdfssuser948499
 
El futurodelos servicio sweb
El futurodelos servicio swebEl futurodelos servicio sweb
El futurodelos servicio swebQuách Tĩnh
 
Cesnavarra 2009-boletín 6
Cesnavarra 2009-boletín 6Cesnavarra 2009-boletín 6
Cesnavarra 2009-boletín 6Cein
 
Cloud computing trabajo final
Cloud computing trabajo finalCloud computing trabajo final
Cloud computing trabajo finalJavier Navarro
 
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABBig data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABOutliers Collective
 
Introducción a Big Data
Introducción a Big DataIntroducción a Big Data
Introducción a Big DataRafael Morales
 
CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosJohn Bulla
 
Making Money Columbia02 Ap Spanish
Making Money Columbia02 Ap SpanishMaking Money Columbia02 Ap Spanish
Making Money Columbia02 Ap Spanishcampus party
 

Similar a Desmitificando BIG DATA: qué es, por qué surge y para qué sirve (20)

Como comprar por Internet
Como comprar por InternetComo comprar por Internet
Como comprar por Internet
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Primeros pasos con Neo4j
Primeros pasos con Neo4jPrimeros pasos con Neo4j
Primeros pasos con Neo4j
 
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABBig data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
 
1.1.que es big_data
1.1.que es big_data1.1.que es big_data
1.1.que es big_data
 
La importancia del Big Data
La importancia del Big DataLa importancia del Big Data
La importancia del Big Data
 
El Internet de las Cosas y las Personas con Internet
El Internet de las Cosas y las Personas con InternetEl Internet de las Cosas y las Personas con Internet
El Internet de las Cosas y las Personas con Internet
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
tecnologias futuras
tecnologias futurastecnologias futuras
tecnologias futuras
 
Diaspositivas de la tecnologia
Diaspositivas de la tecnologiaDiaspositivas de la tecnologia
Diaspositivas de la tecnologia
 
vision general base de datos.pdf
vision general base de datos.pdfvision general base de datos.pdf
vision general base de datos.pdf
 
Elfuturodelos serviciosweb
Elfuturodelos servicioswebElfuturodelos serviciosweb
Elfuturodelos serviciosweb
 
El futurodelos servicio sweb
El futurodelos servicio swebEl futurodelos servicio sweb
El futurodelos servicio sweb
 
Cesnavarra 2009-boletín 6
Cesnavarra 2009-boletín 6Cesnavarra 2009-boletín 6
Cesnavarra 2009-boletín 6
 
Cloud computing trabajo final
Cloud computing trabajo finalCloud computing trabajo final
Cloud computing trabajo final
 
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABBig data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
 
Introducción a Big Data
Introducción a Big DataIntroducción a Big Data
Introducción a Big Data
 
CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datos
 
Como Hacer Dinero Con Software Libre
Como Hacer Dinero Con Software LibreComo Hacer Dinero Con Software Libre
Como Hacer Dinero Con Software Libre
 
Making Money Columbia02 Ap Spanish
Making Money Columbia02 Ap SpanishMaking Money Columbia02 Ap Spanish
Making Money Columbia02 Ap Spanish
 

Último

bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdfAnaBelindaArmellonHi
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffJefersonBazalloCarri1
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 

Último (20)

bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffff
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 

Desmitificando BIG DATA: qué es, por qué surge y para qué sirve

  • 1. desmitificando BIG DATA •Qué es Big Data •Por qué surge •Para qué sirve •El Factor Visualización •Conclusiones
  • 4. Herramientas CASE OrientaciónaObjetos Downsizing RAD Web 2.0 Efecto:2000 .COM DataWarehouse Data Mining Business Intelligence Cliente/Servidor Centro de Información Linux vs Windows Windows vs OS/2 BIG DATA Rightsizing OS/2 vs MS/DOS Unix vs Mainframe Relacional vs Jerárquica ArquitecturaSAA Mcvseverything Programación Estructurada Teleproceso OnLine XML Entidad/Relación Data Mar Metodología B.Datos Relacional Method/1 B.DatosJerárquica MainframeCodigospaghetti
  • 5. Herramientas CASE OrientaciónaObjetos Downsizing RAD Web 2.0 Efecto:2000 .COM DataWarehouse Data Mining Business Intelligence Cliente/Servidor Centro de Información Linux vs Windows Windows vs OS/2 BIG DATA Rightsizing OS/2 vs MS/DOS Unix vs Mainframe Relacional vs Jerárquica ArquitecturaSAA Mcvseverything Programación Estructurada Teleproceso OnLine XML Entidad/Relación Data Mar Metodología B.Datos Relacional Method/1 B.DatosJerárquica MainframeCodigospaghetti “Internet of Thing Próximamente en sus pantallas:
  • 6. “El futuro descansa en diseñar y vender computadoras que la gente no se de cuenta que son computadoras” Adam Osborne, 1983 “La mejor manera de predecir el futuro es inventarlo” Peter F. Drucker “640 K deberían ser suficientes para cualquiera” Bill Gates, 1981
  • 7. Doug Laney: Big data son activos de información de gran volumen, alta velocidad de crecimiento y gran variedad de formatos, que exigen formas innovadoras de proceso de información, para una mejor comprensión y toma de decisiones.
  • 8. [Otras definiciones/reflexiones menos formales] “Big Data es como el sexo adolescente: todos hablan de él, nadie sabe realmente cómo hacerlo y todos piensan que los demás lo hacen...” Frase atribuída a Dan Ariely “Palabra Técnica de moda que todo el mundo usa y nadie entiende muy bien” http://www.languagemonitor.com “Big Data: hemos pasado de no saber qué es, a que todo el mundo proclame que tiene uno, sin que en el intermedio haya ocurrido nada relevante…” Javier Valdés - Logtrust
  • 9. Siempre hay quien lo confunde con sus herramientas…
  • 10. También hay quien lo identifica con: Big Data te vigila…
  • 11. También se dice: Big Data is dead… Según Gartner, el término ha llegado al “Máximo de inflacción de expectativas”
  • 12. Tendemos a sobrevalorar el impacto de la tecnología en el corto plazo…. y a infravalorarlo en el largo.
  • 13.
  • 14. “Se abusa del término Big Data y sus famosas 3 V. Ya hay quien lo detesta y considera que su simple aparición en una conversación o texto es síntoma de falta de rigor…” “Big Data es una de los escasos ejemplos de tecnologías que se definen por ‘el problema’ y no por ‘la solución’. Esa es una de las razones del abuso de tópicos y conceptos sin verdadero significado real.” y sin embargo…
  • 18. El crecimiento de Internet 27.483 PB/mes Si se almacenaran en DVD estándar y se pusieran juntos, medirían la distancia de la Luna a la Tierra… ida y vuelta. http://www.evolutionoftheweb.com/
  • 19. Repasando…Kilobyte (KB) 10 3 megabyte (MB) 10 6 gigabyte (GB) 10 9 terabyte (TB) 10 12 petabyte (PB) 10 15 exabyte (EB) 10 18 zettabyte (ZB) 10 21 yottabyte (YB) 10 24 • Google procesa sobre 20 petabytes de datos cada día •Filmar 100 años de vida de una persona en alta definición (10 megapíxels, 50 fotogramas por segundo) ocuparía 0,5 petabytes. •Facebook tiene 60 mil millones de imágenes, lo que supone 1,5 petabytes de almacenamiento y crece a un ritmo de 220 millones de imágenes por semana.
  • 20. Espectacular caída de costes de almacenamiento… …entramos en la Era Petabyte
  • 21.
  • 22. Datos no estructurados, no catalogados y sin explorar que se encuentran en los repositorios de datos y que aún no han sido analizados ni procesados. Nuevo término: Dark Data Datos conocidos Datos desconocidos, se sabe que existen Datos desconocidos, No se sabe que existen Big Data
  • 23.
  • 24.
  • 25. Factores relevantes: La información no operativa (Dark Data) podría ayudar a tomar decisiones. Poder tomar decisiones antes que los demás es una verdadera ventaja competitiva . •Integrar no solo información operativa •Guardar terabytes de información por día •Hacer consultas sobre ellos •Correlaciones •Hacerlo todo en tiempo real •Y disponer de esta información de forma permanente y longeva ¿ Cómo lo absorbemos? Por lo tanto necesitaríamos:
  • 26. Asimilación de la información El número de conceptos simultáneos que podemos asimilar, oscila entre 5 y 9. ( 7+- 2 ) George A. Miller ¿ Cuanto hace que se rebasó el límite ?
  • 27. Pero no toda la información se procesa de la misma manera… Hay modalidades que se asimilan de forma directa, prácticamente sin necesidad de reflexión
  • 29. Ejemplo de Visualización: •Aparecerá una lista de 7 palabras (dentro de los límites de Miller) •El objetivo es intentar recordarlas después de verlas unos segundosDesperta dor Camisa Piano Casa Sofa Toro Besugo¿ Resultados ? …variables, pero en el mejor de los casos, se nos olvidarán en pocos minutos. Probemos de forma visual:
  • 30.
  • 31. Ejemplo de Visualización: Localizar los “7” de esta figura
  • 32. Ejemplo de Visualización: Representar patrones de correlación
  • 33. En realidad el poder de “lo visual” es algo que conocemos desde hace mucho tiempo…
  • 34. Primer gráfico estadístico conocido: 1644 Michael Florent van Langren, cartógrafo Holandés que proponía un sistema de cálculo de la Longitud. Representación gráfica de la disparidad de valores propuestos para la Longitud entre Toledo y Roma
  • 35. …mejorando el gráfico con medios modernos:
  • 36. William Playfair 1759-1923 – Ingeniero y economista político Escocés, fundador del Método Gráfico Estadístico
  • 37. La Visualización no sólo representa de forma rápida y concisa la información… También permite DESCUBRIRLA Mapa del DR. Snow, 1814 Epidemia de cólera, localización de fuente de agua contaminada
  • 38.
  • 39. Doug Laney: Big data son activos de información de gran volumen, alta velocidad de crecimiento y gran variedad de formatos, que exigen formas innovadoras de proceso de información para una mejor comprensión y toma de decisiones
  • 40. IT Convencional ¿ Big Data ó Collatera
  • 41.
  • 42.
  • 44. ? 1- ¿ Pregunta ? 2- Actividad 3- Obtener Datos y Almacenarlos 4- Ordenación y Estructuración 5- Exploración 5’-Automatismos de Análisis 6- Visualización y Comunicación
  • 45.
  • 46.
  • 47. Ejemplos varios de Visualización Logtrust:
  • 48. En Resumen: •Big Data es una Moda •Big Data no sólo es un acierto de Marketing •Big Data es una Necesidad •Big Data es un Hecho •Big Data es Accesible