SlideShare una empresa de Scribd logo
Un universo de datos. El
fenómeno Big Data y la Ciencia

   Joaquín Salvachúa @ DIT ETSIT UPM
        joaquin.salvachua@upm.es
Movimiento browniano

• Movimiento aleatorio de particulas en un
 medio fluido.

• Analizado en función de la agregación de los
 movimientos de las moléculas del agua.



• ¿Que ocurriría si tuviesemos acceso a los
 movimientos de TODAS las moleculas del
 agua? (en vez de una agregación de datos).
Movimiento browniano
                social toda la
• Actualmente podemos tener
 información de lo que realiza una persona.

• ... Incluso lo que piensa, siente o desea
 (facebook, twitter, etc).

• .. Movimientos (smartCity, smartCar).




• El mundo como un gran fuente de datos.
Datos

• Análisis en casi tiempo real.
• Acceso a mayor cantidad de datos, de todo
 tipo, relevancia y veracidad.

• Posiblidad de almacenarlos todos.
• Posiblidad de procesar y guardar TODOS los
 datos. ( 1 W / n R ).
¿Muerte del método
               científico?
• ¿Modelo analítico? tengo datos...
• Evitar razonar sobre el problema.


• Ciencia guiada por datos.


• El mundo como experimento (gripe)
Big Data

• Capacidad de manipular grandes cantidades
 heterogeneas de datos.

  • Volumen
  • Variedad
  • Velocidad
  • Veracidad
Volumen grande
• Es como lo de antes.. pero más
    • Bussines intelligence.
• ¿Seguro?
• ¿Podemos tener una hormiga de 10 m de
 largo?
Almacenamiento y
          procesado
• Diversos enfoques para sistemas
 distribuidos.

• Problemas de resistencia a caidas, dificultad
 de configuración etc.



• Evitar que sea necesario manejar dichos
 datos.
Sistemas de
              almacenamiento
• BigTable (google GFS ) 2006
• Imitado en Hadoop (HDFS)


• Almacen clave-valor sin estructura.


• Discos baratos y fungibles (3 replicas)
P2P
• Sistemas autoregulados y autoconfigurados.
• Basados en DHT (Distributed Hash Tables)


• Base de los sistemas de compartición de
 ficheros P2P.

• Bases de datos NoSQL
• Sistema deMapReduce
            procesado distribuido
 autoorganizado y autosincronizado.

  • Diseñado por google (2004)
  • Estado en disco.
  • Dos fases.
Hadoop y otras hierbas.


• Proyecto de software libre Apache que
 replica la infraestructura inicial de google.

• Escrito en Java.
• Diversas capas para que sea más sencillo
 usarlo.
Relación con
        CloudComputing
• Despliegue de Hadoop en la nube.
• Pagas por lo que gastas.


• Soporte en los distintos proveedores.
• Engarce con sistemas de almacenamiento y
 de procesado de valores.
Variedad
• Manipulación de datos no estructurados, ni
 agregados.

• Necesidad de “cocinarlos” previamente.
• De múltiples fuentes no disjuntas:
 redundancia.



• Sobrepasar las ideas de la fracasada web
 semántica. (enfoque más pragmatico).
Velocidad
• Problema en transportar datos de un sensor
 a un almacenamiento o entre
 almacenamiento.



• Necesidad de procesarlos rapidamente.
• Esquemas similares a multimedia.
• Uso de GPUs.
• Procesado en “streamming”.
Visualización

• Mark Twain : "Lies, damned lies, and
 statistics Visualization”.

• Componente vital de todo análisis.
• Parte artistica del análisis.


• Nicho de gran futuro.
Privacidad
• Cambio en el esquema.
• Saben como nos comportamos (tipado de
 patos// duck-typing ).
¿Nuestros datos?




            Internet of things



           Socialmedia
IoT & SmartCities
• Fuente de datos en crudo.
• Abundancia de sensores: nuevos API.
• Problemas de almacenamiento: procesado
 distribuido.



• Ciudades inteligentes: propiedad emergente
 de sistemas analizados con BigData.
Problemas prácticos
• Podemos sintetizar atributos a los que
 debemos aplicar la ley de protección de
 datos.

    • Inferir sexo, orientación sexual, religión.


• Dificultad de la anonimización de los datos:
 esquemas de federación de busquedas-
 resultados.
Cerrando el bucle
Periodismo de datos

• Importancia de saber procesar datos no solo
 por científicos.

• Importante para la sociedad.
• OpenData


• Necesidad de entornos sencillos.
“Los limites de mi lenguaje
son los limites de mi mundo”
• R : Comunidad y flexibilidad


• Julia : Rapidez.


• NumPy (selección por parte de Darpa)
Problemas clásicos

• Lo ha dicho el “BigData”: Eliminación de
 teletrabajo en Yahoo (Marisa Mayer).




• GarbageIn-Garbage-Out
Social Media.

• Importancia del analisis basado en ciencia
 de redes.

• Extrapolable a otros campos.
• el Grafo social como “mi tesoro”.
• Ciencia de las redes.
• Necesidad de avances teóricos.
Problemas de procesado de
         grafos
• Almacenamientos poco orientado a análisis
 de grafos



• Nuevos enfoques
• (Google Pregel 2010)
  • ¿ enfoque correcto ?
Future Internet
FI-ware Fi-ppp
Triste es pedir... pero más
      triste es robar.
• Dificultad de acceder a “datasets”
 interesantes.



• ¿Es realmente el nuevo petroleo?


• Enfoques abiertos y colaborativos.
¿ Preguntas?

Más contenido relacionado

Destacado

Programador Jr. para Python Primera Parte
Programador Jr. para Python Primera ParteProgramador Jr. para Python Primera Parte
Programador Jr. para Python Primera Parte
José Luis Chiquete Valdivieso
 
Odd2015 scraping
Odd2015 scrapingOdd2015 scraping
Odd2015 scraping
Renato Ramirez
 
pfSense Platform Binnaris 2014
pfSense Platform Binnaris 2014pfSense Platform Binnaris 2014
pfSense Platform Binnaris 2014
Patricio Ghirardi
 
Pfsense
PfsensePfsense
Primeros Pasos en PyQt4
Primeros Pasos en PyQt4Primeros Pasos en PyQt4
Primeros Pasos en PyQt4
Jesse Padilla Agudelo
 
pfSense, OpenSource Firewall
pfSense, OpenSource FirewallpfSense, OpenSource Firewall
pfSense, OpenSource Firewall
Erik Kirschner
 
Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02Mohamed Houssem
 
El uso de Python en la Ingenieria Química - Charla Completa
El uso de Python en la Ingenieria Química - Charla CompletaEl uso de Python en la Ingenieria Química - Charla Completa
El uso de Python en la Ingenieria Química - Charla Completa
CAChemE
 
Pfsense: securizando tu infraestructura
Pfsense: securizando tu infraestructuraPfsense: securizando tu infraestructura
Pfsense: securizando tu infraestructura
Alex Casanova
 
53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall
Sebastian Berrios Vasquez
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
Escoles Universitàries Gimbernat i Tomàs Cerdà
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
04071977
 
Guide pfsense
Guide pfsenseGuide pfsense
Guide pfsenser_sadoun
 

Destacado (15)

Programador Jr. para Python Primera Parte
Programador Jr. para Python Primera ParteProgramador Jr. para Python Primera Parte
Programador Jr. para Python Primera Parte
 
Odd2015 scraping
Odd2015 scrapingOdd2015 scraping
Odd2015 scraping
 
pfSense Platform Binnaris 2014
pfSense Platform Binnaris 2014pfSense Platform Binnaris 2014
pfSense Platform Binnaris 2014
 
Pfsense
PfsensePfsense
Pfsense
 
Primeros Pasos en PyQt4
Primeros Pasos en PyQt4Primeros Pasos en PyQt4
Primeros Pasos en PyQt4
 
Introducción a PyQt
Introducción a PyQtIntroducción a PyQt
Introducción a PyQt
 
pfSense, OpenSource Firewall
pfSense, OpenSource FirewallpfSense, OpenSource Firewall
pfSense, OpenSource Firewall
 
Pfsense
PfsensePfsense
Pfsense
 
Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02Pfsense 121202023417-phpapp02
Pfsense 121202023417-phpapp02
 
El uso de Python en la Ingenieria Química - Charla Completa
El uso de Python en la Ingenieria Química - Charla CompletaEl uso de Python en la Ingenieria Química - Charla Completa
El uso de Python en la Ingenieria Química - Charla Completa
 
Pfsense: securizando tu infraestructura
Pfsense: securizando tu infraestructuraPfsense: securizando tu infraestructura
Pfsense: securizando tu infraestructura
 
53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall53458737 manual-de-usuario-de-pfsense-firewall
53458737 manual-de-usuario-de-pfsense-firewall
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Guide pfsense
Guide pfsenseGuide pfsense
Guide pfsense
 

Similar a Big data Jornada Fundación Ramón Areces

Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬
Fernando-Ariel Lopez
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
Juan José Domenech
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
Gorka Armentia
 
Desayuno de arquitectos: Big data en azure
Desayuno de arquitectos: Big data en azureDesayuno de arquitectos: Big data en azure
Desayuno de arquitectos: Big data en azure
Guillermo Javier Bellmann
 
Big data
Big dataBig data
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
LuisAzofeifa6
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
Ernesto Mislej
 
SGNext Elasticsearch
SGNext ElasticsearchSGNext Elasticsearch
SGNext Elasticsearch
Domingo Suarez Torres
 
Big data
Big dataBig data
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
Pedro Aaron
 
Big data
Big dataBig data
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académico
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académicoRetos actuales y futuros del Cómputo en la Nube - Un enfoque académico
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académico
Javier Mijail Espadas Pech
 
Esp #001-no son los documentos; son los datos-traducido
 Esp #001-no son los documentos; son los datos-traducido Esp #001-no son los documentos; son los datos-traducido
Esp #001-no son los documentos; son los datos-traducidoJ T "Tom" Johnson
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
Big Data Colombia
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
Luis Fernando Aguas Bucheli
 
Tech tuesday Big data with horton works
Tech tuesday Big data with horton worksTech tuesday Big data with horton works
Tech tuesday Big data with horton works
netmind
 
01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf
AntonioSotoRodriguez1
 
Manual Base Datos
Manual Base DatosManual Base Datos
Manual Base Datos
Indusoft@Sistem S.A
 
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdfUnidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
DanielMarquez902683
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
LosMorales
 

Similar a Big data Jornada Fundación Ramón Areces (20)

Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
Desayuno de arquitectos: Big data en azure
Desayuno de arquitectos: Big data en azureDesayuno de arquitectos: Big data en azure
Desayuno de arquitectos: Big data en azure
 
Big data
Big dataBig data
Big data
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
SGNext Elasticsearch
SGNext ElasticsearchSGNext Elasticsearch
SGNext Elasticsearch
 
Big data
Big dataBig data
Big data
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
 
Big data
Big dataBig data
Big data
 
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académico
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académicoRetos actuales y futuros del Cómputo en la Nube - Un enfoque académico
Retos actuales y futuros del Cómputo en la Nube - Un enfoque académico
 
Esp #001-no son los documentos; son los datos-traducido
 Esp #001-no son los documentos; son los datos-traducido Esp #001-no son los documentos; son los datos-traducido
Esp #001-no son los documentos; son los datos-traducido
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Tech tuesday Big data with horton works
Tech tuesday Big data with horton worksTech tuesday Big data with horton works
Tech tuesday Big data with horton works
 
01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf
 
Manual Base Datos
Manual Base DatosManual Base Datos
Manual Base Datos
 
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdfUnidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
Unidad 1 - Introducción a los Sistemas de Gestión de Bases de Datos.pdf
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 

Más de Joaquín Salvachúa

Eemov data
Eemov dataEemov data
Etica big data
Etica big dataEtica big data
Etica big data
Joaquín Salvachúa
 
FIWARE Data usage control
FIWARE Data usage controlFIWARE Data usage control
FIWARE Data usage control
Joaquín Salvachúa
 
Fiware overview3
Fiware overview3Fiware overview3
Fiware overview3
Joaquín Salvachúa
 
Fiware overview
Fiware overviewFiware overview
Fiware overview
Joaquín Salvachúa
 
Kubernetes2
Kubernetes2Kubernetes2
Kubernetes2
Joaquín Salvachúa
 
Introducción al ecosistema de React.js
Introducción al ecosistema de React.jsIntroducción al ecosistema de React.js
Introducción al ecosistema de React.js
Joaquín Salvachúa
 
FIWARE Identity Manager Exercises
FIWARE Identity Manager ExercisesFIWARE Identity Manager Exercises
FIWARE Identity Manager Exercises
Joaquín Salvachúa
 
FIware Identity Manager
FIware Identity ManagerFIware Identity Manager
FIware Identity Manager
Joaquín Salvachúa
 
Fi ware en Hack for good (#H4G)
Fi ware en Hack for good  (#H4G) Fi ware en Hack for good  (#H4G)
Fi ware en Hack for good (#H4G)
Joaquín Salvachúa
 
Id fiware upm-dit
Id fiware  upm-ditId fiware  upm-dit
Id fiware upm-dit
Joaquín Salvachúa
 
Vagrant
VagrantVagrant
Intro20 socioeconomia
Intro20 socioeconomiaIntro20 socioeconomia
Intro20 socioeconomia
Joaquín Salvachúa
 
Master w20 01
Master w20 01Master w20 01
Master w20 01
Joaquín Salvachúa
 
Social networks upm
Social networks upmSocial networks upm
Social networks upm
Joaquín Salvachúa
 
Identidad2
Identidad2Identidad2

Más de Joaquín Salvachúa (20)

Eemov data
Eemov dataEemov data
Eemov data
 
Etica big data
Etica big dataEtica big data
Etica big data
 
FIWARE Data usage control
FIWARE Data usage controlFIWARE Data usage control
FIWARE Data usage control
 
Fiware overview3
Fiware overview3Fiware overview3
Fiware overview3
 
Fiware overview
Fiware overviewFiware overview
Fiware overview
 
Kubernetes2
Kubernetes2Kubernetes2
Kubernetes2
 
Introducción al ecosistema de React.js
Introducción al ecosistema de React.jsIntroducción al ecosistema de React.js
Introducción al ecosistema de React.js
 
FIWARE Identity Manager Exercises
FIWARE Identity Manager ExercisesFIWARE Identity Manager Exercises
FIWARE Identity Manager Exercises
 
FIware Identity Manager
FIware Identity ManagerFIware Identity Manager
FIware Identity Manager
 
Fi ware en Hack for good (#H4G)
Fi ware en Hack for good  (#H4G) Fi ware en Hack for good  (#H4G)
Fi ware en Hack for good (#H4G)
 
Id fiware upm-dit
Id fiware  upm-ditId fiware  upm-dit
Id fiware upm-dit
 
Vagrant
VagrantVagrant
Vagrant
 
Intro20 socioeconomia
Intro20 socioeconomiaIntro20 socioeconomia
Intro20 socioeconomia
 
Master w20 01
Master w20 01Master w20 01
Master w20 01
 
Blogs micro
Blogs microBlogs micro
Blogs micro
 
Social networks upm
Social networks upmSocial networks upm
Social networks upm
 
Nube redes
Nube redesNube redes
Nube redes
 
Identidad2
Identidad2Identidad2
Identidad2
 
Blogs Micro
Blogs MicroBlogs Micro
Blogs Micro
 
Blogs Micro
Blogs MicroBlogs Micro
Blogs Micro
 

Último

Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
20minutos
 
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptxNuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
lautyzaracho4
 
Junio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividadesJunio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividades
cintiat3400
 
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
María Sánchez González (@cibermarikiya)
 
Examen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdfExamen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdf
20minutos
 
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdfINFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
Alejandrogarciapanta
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
auxsoporte
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
Distea V región
 
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdfAsistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Demetrio Ccesa Rayme
 
Portafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPNPortafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPN
jmorales40
 
Blogs_y_Educacion_Por Zaracho Lautaro_.pdf
Blogs_y_Educacion_Por Zaracho Lautaro_.pdfBlogs_y_Educacion_Por Zaracho Lautaro_.pdf
Blogs_y_Educacion_Por Zaracho Lautaro_.pdf
lautyzaracho4
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
GallardoJahse
 
Mapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativaMapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativa
TatianaVanessaAltami
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
JAVIER SOLIS NOYOLA
 
Sesión: El espiritismo desenmascarado.pdf
Sesión: El espiritismo desenmascarado.pdfSesión: El espiritismo desenmascarado.pdf
Sesión: El espiritismo desenmascarado.pdf
https://gramadal.wordpress.com/
 
Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
danitarb
 
Evaluación de Lengua Española de cuarto grado de primaria
Evaluación de Lengua Española de cuarto grado de primariaEvaluación de Lengua Española de cuarto grado de primaria
Evaluación de Lengua Española de cuarto grado de primaria
SoniaMedina49
 
IMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁ
IMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁIMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁ
IMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁ
Claude LaCombe
 
PLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxx
PLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxxPLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxx
PLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxx
cportizsanchez48
 
ENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docx
ENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docxENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docx
ENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docx
SandraPiza2
 

Último (20)

Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
 
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptxNuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
 
Junio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividadesJunio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividades
 
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
 
Examen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdfExamen Lengua y Literatura EVAU Andalucía.pdf
Examen Lengua y Literatura EVAU Andalucía.pdf
 
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdfINFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
INFORME MINEDU DEL PRIMER SIMULACRO 2024.pdf
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
 
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdfAsistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
Asistencia Tecnica Cultura Escolar Inclusiva Ccesa007.pdf
 
Portafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPNPortafolio de servicios Centro de Educación Continua EPN
Portafolio de servicios Centro de Educación Continua EPN
 
Blogs_y_Educacion_Por Zaracho Lautaro_.pdf
Blogs_y_Educacion_Por Zaracho Lautaro_.pdfBlogs_y_Educacion_Por Zaracho Lautaro_.pdf
Blogs_y_Educacion_Por Zaracho Lautaro_.pdf
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
 
Mapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativaMapa_Conceptual de los fundamentos de la evaluación educativa
Mapa_Conceptual de los fundamentos de la evaluación educativa
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
 
Sesión: El espiritismo desenmascarado.pdf
Sesión: El espiritismo desenmascarado.pdfSesión: El espiritismo desenmascarado.pdf
Sesión: El espiritismo desenmascarado.pdf
 
Libro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdfLibro infantil sapo y sepo un año entero pdf
Libro infantil sapo y sepo un año entero pdf
 
Evaluación de Lengua Española de cuarto grado de primaria
Evaluación de Lengua Española de cuarto grado de primariaEvaluación de Lengua Española de cuarto grado de primaria
Evaluación de Lengua Española de cuarto grado de primaria
 
IMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁ
IMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁIMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁ
IMÁGENES SUBLIMINALES EN LAS PUBLICACIONES DE LOS TESTIGOS DE JEHOVÁ
 
PLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxx
PLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxxPLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxx
PLAN DE CAPACITACION xxxxxxxxxxxxxxxxxxx
 
ENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docx
ENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docxENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docx
ENSAYO SOBRE LA ANSIEDAD Y LA DEPRESION.docx
 

Big data Jornada Fundación Ramón Areces

  • 1. Un universo de datos. El fenómeno Big Data y la Ciencia Joaquín Salvachúa @ DIT ETSIT UPM joaquin.salvachua@upm.es
  • 2. Movimiento browniano • Movimiento aleatorio de particulas en un medio fluido. • Analizado en función de la agregación de los movimientos de las moléculas del agua. • ¿Que ocurriría si tuviesemos acceso a los movimientos de TODAS las moleculas del agua? (en vez de una agregación de datos).
  • 3. Movimiento browniano social toda la • Actualmente podemos tener información de lo que realiza una persona. • ... Incluso lo que piensa, siente o desea (facebook, twitter, etc). • .. Movimientos (smartCity, smartCar). • El mundo como un gran fuente de datos.
  • 4. Datos • Análisis en casi tiempo real. • Acceso a mayor cantidad de datos, de todo tipo, relevancia y veracidad. • Posiblidad de almacenarlos todos. • Posiblidad de procesar y guardar TODOS los datos. ( 1 W / n R ).
  • 5. ¿Muerte del método científico? • ¿Modelo analítico? tengo datos... • Evitar razonar sobre el problema. • Ciencia guiada por datos. • El mundo como experimento (gripe)
  • 6. Big Data • Capacidad de manipular grandes cantidades heterogeneas de datos. • Volumen • Variedad • Velocidad • Veracidad
  • 7. Volumen grande • Es como lo de antes.. pero más • Bussines intelligence. • ¿Seguro? • ¿Podemos tener una hormiga de 10 m de largo?
  • 8. Almacenamiento y procesado • Diversos enfoques para sistemas distribuidos. • Problemas de resistencia a caidas, dificultad de configuración etc. • Evitar que sea necesario manejar dichos datos.
  • 9. Sistemas de almacenamiento • BigTable (google GFS ) 2006 • Imitado en Hadoop (HDFS) • Almacen clave-valor sin estructura. • Discos baratos y fungibles (3 replicas)
  • 10. P2P • Sistemas autoregulados y autoconfigurados. • Basados en DHT (Distributed Hash Tables) • Base de los sistemas de compartición de ficheros P2P. • Bases de datos NoSQL
  • 11. • Sistema deMapReduce procesado distribuido autoorganizado y autosincronizado. • Diseñado por google (2004) • Estado en disco. • Dos fases.
  • 12. Hadoop y otras hierbas. • Proyecto de software libre Apache que replica la infraestructura inicial de google. • Escrito en Java. • Diversas capas para que sea más sencillo usarlo.
  • 13. Relación con CloudComputing • Despliegue de Hadoop en la nube. • Pagas por lo que gastas. • Soporte en los distintos proveedores. • Engarce con sistemas de almacenamiento y de procesado de valores.
  • 14. Variedad • Manipulación de datos no estructurados, ni agregados. • Necesidad de “cocinarlos” previamente. • De múltiples fuentes no disjuntas: redundancia. • Sobrepasar las ideas de la fracasada web semántica. (enfoque más pragmatico).
  • 15. Velocidad • Problema en transportar datos de un sensor a un almacenamiento o entre almacenamiento. • Necesidad de procesarlos rapidamente. • Esquemas similares a multimedia. • Uso de GPUs. • Procesado en “streamming”.
  • 16. Visualización • Mark Twain : "Lies, damned lies, and statistics Visualization”. • Componente vital de todo análisis. • Parte artistica del análisis. • Nicho de gran futuro.
  • 17. Privacidad • Cambio en el esquema. • Saben como nos comportamos (tipado de patos// duck-typing ).
  • 18. ¿Nuestros datos? Internet of things Socialmedia
  • 19. IoT & SmartCities • Fuente de datos en crudo. • Abundancia de sensores: nuevos API. • Problemas de almacenamiento: procesado distribuido. • Ciudades inteligentes: propiedad emergente de sistemas analizados con BigData.
  • 20. Problemas prácticos • Podemos sintetizar atributos a los que debemos aplicar la ley de protección de datos. • Inferir sexo, orientación sexual, religión. • Dificultad de la anonimización de los datos: esquemas de federación de busquedas- resultados.
  • 22. Periodismo de datos • Importancia de saber procesar datos no solo por científicos. • Importante para la sociedad. • OpenData • Necesidad de entornos sencillos.
  • 23. “Los limites de mi lenguaje son los limites de mi mundo” • R : Comunidad y flexibilidad • Julia : Rapidez. • NumPy (selección por parte de Darpa)
  • 24. Problemas clásicos • Lo ha dicho el “BigData”: Eliminación de teletrabajo en Yahoo (Marisa Mayer). • GarbageIn-Garbage-Out
  • 25. Social Media. • Importancia del analisis basado en ciencia de redes. • Extrapolable a otros campos. • el Grafo social como “mi tesoro”. • Ciencia de las redes. • Necesidad de avances teóricos.
  • 26. Problemas de procesado de grafos • Almacenamientos poco orientado a análisis de grafos • Nuevos enfoques • (Google Pregel 2010) • ¿ enfoque correcto ?
  • 28. Triste es pedir... pero más triste es robar. • Dificultad de acceder a “datasets” interesantes. • ¿Es realmente el nuevo petroleo? • Enfoques abiertos y colaborativos.