SlideShare una empresa de Scribd logo
1 de 32
Descargar para leer sin conexión
‘BIG DATA’
‘No envíes un humano a hacer el trabajo de
una máquina’ [Agente Smith, ‘The Matrix’]
eHealth technology unit
Vicent Ribas
Data Analytics in Medicine Manager
05/04/2017
“ innovation for the industry” 6
SPAINSVERIGE
ANNs (DSP)
KTH
Stockholm
PRE-DOC DOC POST-DOC
Data Mining
CONSULT.
ANNs
(+)
Traffic Analysis
ACN (France)
ANNs
(+)
CV Function
Data
Mining
Startup
(BCN)
ANNs
(+)
Infl. Diseases
IDIBAPS/
VHIR/EUT
XXth century
Research Line
Manager @ EUT
MSc
Applied
Math /
Telecom
Eng.
H2020 reviewer
XXIst century
7The eHealth Unit
Medicina personalizada para la mejora en el diagnóstico, tratamiento
personalizado, para una mejora del pronóstico y una mejor comprensión de los
procesos patofisiológicos.
Data analytics in medicine
8The eHealth Unit
Data analytics in medicine
Decision
SupportSystems
Diagnosis
Early detection of diseases,
screening, …
Data Warehouses
Data collection, Interoperability,
EHR, HL7, Data Marts,
Ontologies, Big Data, ...
Expert Systems
Knowledge modeling, rules,
Clinical guidelines, …
Data Analytics
Knowledge extraction,
statistics, correlation, ...
Online Analytical Processing
Multidimensional analysis, Data
Models, Healthcare Intelligence.
DataMining
Association rules and
Nearest-neighbor search
Knowledge modeling, rules, …
Clustering
Case based reasoning,
decision trees, rule-based
predictive models, ...
Data stream mining
Incremental, real-time analysis,
mobile analytics, Big Data, ...
Data cleaning
Data curation, semantic annotation ,
anomalous value detection, ...
MachineLearning
MLAlgorithms,Supervisedandunsupervisedlearning,
crossvalidation,…
Prognosis
Patient’s evolution, risk
prediction, comorbidity
analysis, etc
Therapy response
Therapy validation,
development of new drugs , …
Doctors,caregivers,
patients,biomedicaland
clinicalresearchers
Hospitals,Laboratories,Clinical
researchcentres,
Pharmaceuticalcompanies,
andpublichealthinstitutions
ArtificialIntelligence
Probabilisticreasoning,Casualreasoningand
diagnostics,distributedartificialintelligence,…
Desarrollamos Sistemas de Soporte al a Decisión Clínica integrables en diferentes plataformas.
9The eHealth Unit
Proyectos
Shockomics
PEGASO
SYNERGY COPD
TSI-020100-2010-674 Smart ECG
TSI-020100-2010-625 Integra UCI
DoCHANGE
CONNECARE
MOVECARE
REWIRE
BACKHOME
CLOCKWORK
Co-Chair for FET RIA
10
The eHealth Unit
Algo de contexto sobre Big Data
• Mis datos
• Messenger
• Fotos
• Posts
• Contactos
• Apps instaladas en el móvil
TOTAL: 100 MB
• Mensajes
• Contactos
• Fotos
• Otros???
TOTAL: 2 GB
• Posts
• Fotos
• Otros???
TOTAL: 75,4 MB
• Playlists
• Podcasts
• Otros???
TOTAL: 2,41 GB
• Notas
• Bibliografía
• Otros???
TOTAL: 1,44 GB
• Aplicaciones
• Datos de salud
• Datos bancarios
• Etc… (enganchado al
iWARE)
TOTAL: 43 GB
11
The eHealth Unit
Algo de contexto sobre Big Data
• Y un enfermo ‘medio’ en una UCI?
Data # parameters / bed and day Estimated size / bed and day
Clinical data 900 1.76 KB
Environmental data 20 160 B
Monitoring and pump
data
5 82.5 MB
Other data 20 160 B
TOTAL 945 parameters 90 MB / day
12
The eHealth Unit
Algo de contexto sobre Big Data
• Y un enfermo ‘medio’ en una UCI?
Data # parameters / bed and day Estimated size / bed and day
Clinical data 900 1.76 KB
Environmental data 20 160 B
Monitoring and pump
data
5 82.5 MB
Other data 20 160 B
TOTAL 945 parameters 90 MB / day
13
The eHealth Unit
Algo de contexto sobre Big Data
• El tamaño importa?
14
The eHealth Unit
Algo de contexto sobre Big Data
• El tamaño importa? [Mis datasets en el tiempo]
1999 DARPA TIMIT DB
15 KB
2001 Carrefour Network
50 MB
2003 MINECO Web Analysis
100 MB
2007 Blood Pressure Data
300 MB
2012 Smart ECG Data
400 MB
2015 LC Screening Data
500 GB
2015 Shockomics
1 TB
-2
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7
15
The eHealth Unit
Algo de contexto sobre Big Data
• Algunos datos interesantes:
• Google procesa 20PB de datos cada dia.
• YouTube genera 27PB en tráfico de datos por año.
• NetFlix y Youtube ocupan la mitad del tráfico de Internet.
• El gran colisionador de hadrones (LHC) del CERN genera cerca de 20PB de
datos útiles al año.
• El volumen anual de tráfico IP llegará a los 3.3ZB en 2021 o 278EB al mes.
• En 2016 el tráfico IP fue de 1.2ZB (anual) o 96EB al mes.
• En la próxima década, los astrónomos esperan procesar 10PB de datos cada
hora del telescopio Square Kilometre Array (SKA).
• TABLA DE CONVERSIÓN (Número de Avogadro = 6,022 x 1023 ):
NOTACIÓN INGENIERIA DECIMAL
1PB 1015 Bytes
1EB 1018 Bytes
1ZB 1021 Bytes
16
The eHealth Unit
Vale, pero esto solo afecta a Telcos y NSA no?
17
The eHealth Unit
Vale, pero esto solo afecta a Telcos y NSA no?
• Los biólogos también se han apuntado al club del Big Data. Con el advenimiento del
‘high-throughput’ genomics, los expertos en ciencias de la vida han empezado a
analizar conjuntos de datos masivos, encontrándose con problemas en el manejo,
procesado, y transporte de información que antes era del dominio de astrónomos y
físicos especializados en alta energía.
• El Instituto Europeo de Bioinformática (IBI) en Hinxton (UK), […] uno de los mayores
repositorios de datos biológicos del mundo, actualmente almacena 20PB […] de datos
en backups de genes, proteínas y moléculas. Los datos genéticos representan un 10%
de esta cifra y este número se dobla cada año.
18
The eHealth Unit
Vale, pero esto solo afecta a Telcos y NSA no?
• A medida que los precios de los instrumentos de secuenciación baja, los pequeños
laboratorios de biología pueden convertirse en generadores de Big Data. Incluso
laboratorios sin estos instrumentos pueden convertirse en usuarios de Big Data
accediendo a TB de datos de repositorios públicos como EBI o US National Center for
Biotechnology Information en Bethesda (Maryland). En 2012, el EBI recibió 9 millones
de búsquedas en su repositorio.
• Esto significa que los científicos deben almacenar grandes conjuntos de datos,
analizarlos, compararlos y compartirlos. La secuenciación genómica de una sola
persona comprende alrededor de 140Gb de datos. Para comparar genomas se necesita
más que un PC y un sistema de compartición de archivos online.
19
The eHealth Unit
Vale, pero esto solo afecta a Telcos y NSA no?
• Gran parte de la construcción de modelos en Big Data para biología es virtual y con un
claro foco en ‘cloud computing’.
• Una de las herramientas más usadas es el ENSBML genome browser operado de forma
conjunta entre EBI y el Wellcome Trust Sanger Institute en Hinxton. Los servidores
principales de ENSBML se encuentran en el Reino Unido pero cuando los usuarios de
los EEUU y Japon tuvieron dificultades en acceder a los datos, el EBI resolvió el
problema contratando servidores ‘espejo’ (mirror sites) en los centros de datos de
Amazon Web Services Elastic Compute Cloud (E2C).
• Otras plataformas de Cloud Computing comúnmente utilizadas son las de Microsoft
Azure o las de Fujitsu Cloud Service (K5).
• Las plataformas en la nube son una solución pero también suponen retos importantes.
Irónicamente, su proliferación puede suponer también un cuello de botella si los datos
acaban en varias nubes y, por lo tanto, tienen que moverse para ser compartidos. A
parte, el uso de la nube también supone encomendar datos sensibles a un
proveedor remoto.
20
The eHealth Unit
Vale, pero esto solo afecta a Telcos y NSA no?
O cómo hacer ‘trampas’ en unas elecciones:
the Cambridge Analytics Issue
21
The eHealth Unit
Vale, pero esto solo afecta a Telcos y NSA no?
22
The eHealth Unit
Vale, pero esto solo afecta a Telcos y NSA no?
23
The eHealth Unit
Investigación médica a escala fisiológica
Biological processes Physiological
scale
Industrial sector Application domain
Molecular biology Genome and
physiome
Bioinformatics
Pharmaceutics
Susceptibility to disease
Metabolic pathways Targets for intervention
Cytology and histology Cell and tissue
levels
Systems biology
Laboratory tests
Disease diagnosis
Medical imaging Organ level Neuroinformatics
Medical informatics
Medical equipment &
instrumentation
Pharmaceutics
Anatomical and physiological
monitoring
Electrophysiological
measurement
Clinical signs System level Diagnosis, prognosis and
screening
Out-of-hospital care Level of the
individual
Ambulatory monitoring for early
diagnosis
Lifestyle factors Population level Public health
informatics
Disease protection and
prevention
25
The eHealth Unit
Estratificación
Source: Clayton Christensen, ‘The Innovator´s Prescription’
26
The eHealth Unit
Cambio de hábitos?
Source: Clayton Christensen, ‘The Innovator´s Prescription’
27
The eHealth Unit
Ciclo de vida proyecto Big Data
28
The eHealth Unit
Proyecto en el área de salud
• Análisis multiómico del shock.
- El shock se define como una bajada significativa de la tensión arterial
refractaria a la administración de fluidos.
- Las principales fuentes de shock son: infección (shock séptico) y
disfunción cardiovascular (shock cardiogénico).
- La tasa de mortalidad del shock es > 70%.
29
The eHealth Unit
Proyecto en el área de salud
• Contexto sobre los datos.
- Datos de 73 pacientes ingresados en dos UCIs (Bélgica y Ginebra).
- Análisis transcriptómico, proteómico y metabolómico a partir de muestras
de plasma obtenidas durante la admisión en la UCI, a las 48 h y a los 5
días.
- En total, se obtienen ~15000 mRNA, ~5000 proteínas + ~ 5000 péptidos
y ~500 metabolitos. En total, 1TB de datos analizados.
30
The eHealth Unit
Modelo gráfico resultante
31
The eHealth Unit
Algo de rabiosa actualidad
• DEEP LEARNING
- Aprendizaje imitando el funcionamiento del cerebro humano.
- Resumir información
- Detección de patrones
- Soporte al diagnóstico
- Descripción de imágenes
- Generación de contenidos
- Jugar a ‘Go’
32
The eHealth Unit
33
The eHealth Unit

Más contenido relacionado

Similar a Presentacion big data

Presentacion hce manuel&eugenio
Presentacion hce manuel&eugenioPresentacion hce manuel&eugenio
Presentacion hce manuel&eugenioFeanor Silmaril
 
Farmacovigilancia. La Gestión de RCIS a través de las herramientas del UMC
Farmacovigilancia. La Gestión de RCIS a través de las herramientas del UMCFarmacovigilancia. La Gestión de RCIS a través de las herramientas del UMC
Farmacovigilancia. La Gestión de RCIS a través de las herramientas del UMCCENAVIF
 
Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...
Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...
Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...José Luis Martínez Fernández
 
PACS SISTEMA DE COMUNICACIÓN Y ARCHIVO
PACS SISTEMA DE COMUNICACIÓN Y ARCHIVOPACS SISTEMA DE COMUNICACIÓN Y ARCHIVO
PACS SISTEMA DE COMUNICACIÓN Y ARCHIVOCesar Alba
 
planificacion sanitaria materia 5 power point.pptx
planificacion sanitaria materia 5 power point.pptxplanificacion sanitaria materia 5 power point.pptx
planificacion sanitaria materia 5 power point.pptxAngelDelRosarioMedin
 
Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...
Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...
Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...Ignacio Basagoiti
 
Herramientas de tic en medicina
Herramientas de tic en medicinaHerramientas de tic en medicina
Herramientas de tic en medicinaAnthonyf127
 
Presentacionris pacs-dicom-v4-120906201823-phpapp01
Presentacionris pacs-dicom-v4-120906201823-phpapp01Presentacionris pacs-dicom-v4-120906201823-phpapp01
Presentacionris pacs-dicom-v4-120906201823-phpapp01Brisa Roldan
 
Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...
Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...
Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...COM SALUD
 
Interoperabilidad ehCOS CLINIC y wearables ( pulsómetros)
Interoperabilidad ehCOS CLINIC y  wearables ( pulsómetros)Interoperabilidad ehCOS CLINIC y  wearables ( pulsómetros)
Interoperabilidad ehCOS CLINIC y wearables ( pulsómetros)everis/ ehCOS
 
Experiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMI
Experiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMIExperiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMI
Experiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMISergio Montenegro
 
Gestion tecnologica
Gestion tecnologicaGestion tecnologica
Gestion tecnologicaLorena Ohmen
 
Implementación de Registros Clínicos Automatizados
Implementación de Registros Clínicos AutomatizadosImplementación de Registros Clínicos Automatizados
Implementación de Registros Clínicos Automatizadostibisay_hernandez
 
4. informática en salud estándares e interoperabilidad
4. informática en salud   estándares e interoperabilidad4. informática en salud   estándares e interoperabilidad
4. informática en salud estándares e interoperabilidadEver Augusto Torres Silva
 
Datlas Analytics para Salud en México
Datlas Analytics para Salud en MéxicoDatlas Analytics para Salud en México
Datlas Analytics para Salud en MéxicoDatlas
 
Informatica en la medicina
Informatica en la medicinaInformatica en la medicina
Informatica en la medicinaJennifer Galindo
 

Similar a Presentacion big data (20)

Presentacion hce manuel&eugenio
Presentacion hce manuel&eugenioPresentacion hce manuel&eugenio
Presentacion hce manuel&eugenio
 
Arquitectura IoT
Arquitectura IoTArquitectura IoT
Arquitectura IoT
 
Farmacovigilancia. La Gestión de RCIS a través de las herramientas del UMC
Farmacovigilancia. La Gestión de RCIS a través de las herramientas del UMCFarmacovigilancia. La Gestión de RCIS a través de las herramientas del UMC
Farmacovigilancia. La Gestión de RCIS a través de las herramientas del UMC
 
Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...
Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...
Big Data en salud: tecnologías para conocer mejor a los pacientes a través de...
 
PACS SISTEMA DE COMUNICACIÓN Y ARCHIVO
PACS SISTEMA DE COMUNICACIÓN Y ARCHIVOPACS SISTEMA DE COMUNICACIÓN Y ARCHIVO
PACS SISTEMA DE COMUNICACIÓN Y ARCHIVO
 
planificacion sanitaria materia 5 power point.pptx
planificacion sanitaria materia 5 power point.pptxplanificacion sanitaria materia 5 power point.pptx
planificacion sanitaria materia 5 power point.pptx
 
Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...
Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...
Compartir conocimientos. ¿Solo una tendencia o una nueva forma de actualizaci...
 
Herramientas de tic en medicina
Herramientas de tic en medicinaHerramientas de tic en medicina
Herramientas de tic en medicina
 
Presentacionris pacs-dicom-v4-120906201823-phpapp01
Presentacionris pacs-dicom-v4-120906201823-phpapp01Presentacionris pacs-dicom-v4-120906201823-phpapp01
Presentacionris pacs-dicom-v4-120906201823-phpapp01
 
Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...
Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...
Eduardo Llinares - Integración de wearables y Big Data en la historia clínica...
 
Interoperabilidad ehCOS CLINIC y wearables ( pulsómetros)
Interoperabilidad ehCOS CLINIC y  wearables ( pulsómetros)Interoperabilidad ehCOS CLINIC y  wearables ( pulsómetros)
Interoperabilidad ehCOS CLINIC y wearables ( pulsómetros)
 
Experiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMI
Experiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMIExperiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMI
Experiencias sobre el uso de TICs en la Provincia de Misiones - Proyecto RISMI
 
PACS, RIS y HIS
PACS, RIS y HISPACS, RIS y HIS
PACS, RIS y HIS
 
Gestion tecnologica
Gestion tecnologicaGestion tecnologica
Gestion tecnologica
 
Implementación de Registros Clínicos Automatizados
Implementación de Registros Clínicos AutomatizadosImplementación de Registros Clínicos Automatizados
Implementación de Registros Clínicos Automatizados
 
Rayos x digitalizacion
Rayos x digitalizacionRayos x digitalizacion
Rayos x digitalizacion
 
Las TICs en salud
Las TICs en saludLas TICs en salud
Las TICs en salud
 
4. informática en salud estándares e interoperabilidad
4. informática en salud   estándares e interoperabilidad4. informática en salud   estándares e interoperabilidad
4. informática en salud estándares e interoperabilidad
 
Datlas Analytics para Salud en México
Datlas Analytics para Salud en MéxicoDatlas Analytics para Salud en México
Datlas Analytics para Salud en México
 
Informatica en la medicina
Informatica en la medicinaInformatica en la medicina
Informatica en la medicina
 

Más de Vicente RIBAS-RIPOLL

Modelling the Variability in the Insuline-Glucose Feedback System
Modelling the Variability in the Insuline-Glucose Feedback SystemModelling the Variability in the Insuline-Glucose Feedback System
Modelling the Variability in the Insuline-Glucose Feedback SystemVicente RIBAS-RIPOLL
 
Modelling the variability of evolutionary processes
Modelling the variability of evolutionary processesModelling the variability of evolutionary processes
Modelling the variability of evolutionary processesVicente RIBAS-RIPOLL
 
Disrupting healthcare with technology
Disrupting healthcare with technologyDisrupting healthcare with technology
Disrupting healthcare with technologyVicente RIBAS-RIPOLL
 
PhD thesis "On the intelligent Management of Sepsis"
PhD thesis "On the intelligent Management of Sepsis"PhD thesis "On the intelligent Management of Sepsis"
PhD thesis "On the intelligent Management of Sepsis"Vicente RIBAS-RIPOLL
 

Más de Vicente RIBAS-RIPOLL (10)

Presentation iwbbio
Presentation iwbbioPresentation iwbbio
Presentation iwbbio
 
Shockomics milano april_2016_v2
Shockomics milano april_2016_v2Shockomics milano april_2016_v2
Shockomics milano april_2016_v2
 
Modelling the Variability in the Insuline-Glucose Feedback System
Modelling the Variability in the Insuline-Glucose Feedback SystemModelling the Variability in the Insuline-Glucose Feedback System
Modelling the Variability in the Insuline-Glucose Feedback System
 
Modelling the variability of evolutionary processes
Modelling the variability of evolutionary processesModelling the variability of evolutionary processes
Modelling the variability of evolutionary processes
 
Poster Experimental Biology 2014
Poster Experimental Biology 2014Poster Experimental Biology 2014
Poster Experimental Biology 2014
 
Rvm sepsis mortality_index_beamer
Rvm sepsis mortality_index_beamerRvm sepsis mortality_index_beamer
Rvm sepsis mortality_index_beamer
 
Disrupting healthcare with technology
Disrupting healthcare with technologyDisrupting healthcare with technology
Disrupting healthcare with technology
 
Thursday 15h45 vicent_ribas ESANN
Thursday 15h45 vicent_ribas ESANNThursday 15h45 vicent_ribas ESANN
Thursday 15h45 vicent_ribas ESANN
 
PhD Defense
PhD DefensePhD Defense
PhD Defense
 
PhD thesis "On the intelligent Management of Sepsis"
PhD thesis "On the intelligent Management of Sepsis"PhD thesis "On the intelligent Management of Sepsis"
PhD thesis "On the intelligent Management of Sepsis"
 

Último

Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 

Último (20)

Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 

Presentacion big data

  • 1. ‘BIG DATA’ ‘No envíes un humano a hacer el trabajo de una máquina’ [Agente Smith, ‘The Matrix’] eHealth technology unit Vicent Ribas Data Analytics in Medicine Manager 05/04/2017
  • 2.
  • 3.
  • 4.
  • 5.
  • 6. “ innovation for the industry” 6 SPAINSVERIGE ANNs (DSP) KTH Stockholm PRE-DOC DOC POST-DOC Data Mining CONSULT. ANNs (+) Traffic Analysis ACN (France) ANNs (+) CV Function Data Mining Startup (BCN) ANNs (+) Infl. Diseases IDIBAPS/ VHIR/EUT XXth century Research Line Manager @ EUT MSc Applied Math / Telecom Eng. H2020 reviewer XXIst century
  • 7. 7The eHealth Unit Medicina personalizada para la mejora en el diagnóstico, tratamiento personalizado, para una mejora del pronóstico y una mejor comprensión de los procesos patofisiológicos. Data analytics in medicine
  • 8. 8The eHealth Unit Data analytics in medicine Decision SupportSystems Diagnosis Early detection of diseases, screening, … Data Warehouses Data collection, Interoperability, EHR, HL7, Data Marts, Ontologies, Big Data, ... Expert Systems Knowledge modeling, rules, Clinical guidelines, … Data Analytics Knowledge extraction, statistics, correlation, ... Online Analytical Processing Multidimensional analysis, Data Models, Healthcare Intelligence. DataMining Association rules and Nearest-neighbor search Knowledge modeling, rules, … Clustering Case based reasoning, decision trees, rule-based predictive models, ... Data stream mining Incremental, real-time analysis, mobile analytics, Big Data, ... Data cleaning Data curation, semantic annotation , anomalous value detection, ... MachineLearning MLAlgorithms,Supervisedandunsupervisedlearning, crossvalidation,… Prognosis Patient’s evolution, risk prediction, comorbidity analysis, etc Therapy response Therapy validation, development of new drugs , … Doctors,caregivers, patients,biomedicaland clinicalresearchers Hospitals,Laboratories,Clinical researchcentres, Pharmaceuticalcompanies, andpublichealthinstitutions ArtificialIntelligence Probabilisticreasoning,Casualreasoningand diagnostics,distributedartificialintelligence,… Desarrollamos Sistemas de Soporte al a Decisión Clínica integrables en diferentes plataformas.
  • 9. 9The eHealth Unit Proyectos Shockomics PEGASO SYNERGY COPD TSI-020100-2010-674 Smart ECG TSI-020100-2010-625 Integra UCI DoCHANGE CONNECARE MOVECARE REWIRE BACKHOME CLOCKWORK Co-Chair for FET RIA
  • 10. 10 The eHealth Unit Algo de contexto sobre Big Data • Mis datos • Messenger • Fotos • Posts • Contactos • Apps instaladas en el móvil TOTAL: 100 MB • Mensajes • Contactos • Fotos • Otros??? TOTAL: 2 GB • Posts • Fotos • Otros??? TOTAL: 75,4 MB • Playlists • Podcasts • Otros??? TOTAL: 2,41 GB • Notas • Bibliografía • Otros??? TOTAL: 1,44 GB • Aplicaciones • Datos de salud • Datos bancarios • Etc… (enganchado al iWARE) TOTAL: 43 GB
  • 11. 11 The eHealth Unit Algo de contexto sobre Big Data • Y un enfermo ‘medio’ en una UCI? Data # parameters / bed and day Estimated size / bed and day Clinical data 900 1.76 KB Environmental data 20 160 B Monitoring and pump data 5 82.5 MB Other data 20 160 B TOTAL 945 parameters 90 MB / day
  • 12. 12 The eHealth Unit Algo de contexto sobre Big Data • Y un enfermo ‘medio’ en una UCI? Data # parameters / bed and day Estimated size / bed and day Clinical data 900 1.76 KB Environmental data 20 160 B Monitoring and pump data 5 82.5 MB Other data 20 160 B TOTAL 945 parameters 90 MB / day
  • 13. 13 The eHealth Unit Algo de contexto sobre Big Data • El tamaño importa?
  • 14. 14 The eHealth Unit Algo de contexto sobre Big Data • El tamaño importa? [Mis datasets en el tiempo] 1999 DARPA TIMIT DB 15 KB 2001 Carrefour Network 50 MB 2003 MINECO Web Analysis 100 MB 2007 Blood Pressure Data 300 MB 2012 Smart ECG Data 400 MB 2015 LC Screening Data 500 GB 2015 Shockomics 1 TB -2 0 2 4 6 8 10 12 14 1 2 3 4 5 6 7
  • 15. 15 The eHealth Unit Algo de contexto sobre Big Data • Algunos datos interesantes: • Google procesa 20PB de datos cada dia. • YouTube genera 27PB en tráfico de datos por año. • NetFlix y Youtube ocupan la mitad del tráfico de Internet. • El gran colisionador de hadrones (LHC) del CERN genera cerca de 20PB de datos útiles al año. • El volumen anual de tráfico IP llegará a los 3.3ZB en 2021 o 278EB al mes. • En 2016 el tráfico IP fue de 1.2ZB (anual) o 96EB al mes. • En la próxima década, los astrónomos esperan procesar 10PB de datos cada hora del telescopio Square Kilometre Array (SKA). • TABLA DE CONVERSIÓN (Número de Avogadro = 6,022 x 1023 ): NOTACIÓN INGENIERIA DECIMAL 1PB 1015 Bytes 1EB 1018 Bytes 1ZB 1021 Bytes
  • 16. 16 The eHealth Unit Vale, pero esto solo afecta a Telcos y NSA no?
  • 17. 17 The eHealth Unit Vale, pero esto solo afecta a Telcos y NSA no? • Los biólogos también se han apuntado al club del Big Data. Con el advenimiento del ‘high-throughput’ genomics, los expertos en ciencias de la vida han empezado a analizar conjuntos de datos masivos, encontrándose con problemas en el manejo, procesado, y transporte de información que antes era del dominio de astrónomos y físicos especializados en alta energía. • El Instituto Europeo de Bioinformática (IBI) en Hinxton (UK), […] uno de los mayores repositorios de datos biológicos del mundo, actualmente almacena 20PB […] de datos en backups de genes, proteínas y moléculas. Los datos genéticos representan un 10% de esta cifra y este número se dobla cada año.
  • 18. 18 The eHealth Unit Vale, pero esto solo afecta a Telcos y NSA no? • A medida que los precios de los instrumentos de secuenciación baja, los pequeños laboratorios de biología pueden convertirse en generadores de Big Data. Incluso laboratorios sin estos instrumentos pueden convertirse en usuarios de Big Data accediendo a TB de datos de repositorios públicos como EBI o US National Center for Biotechnology Information en Bethesda (Maryland). En 2012, el EBI recibió 9 millones de búsquedas en su repositorio. • Esto significa que los científicos deben almacenar grandes conjuntos de datos, analizarlos, compararlos y compartirlos. La secuenciación genómica de una sola persona comprende alrededor de 140Gb de datos. Para comparar genomas se necesita más que un PC y un sistema de compartición de archivos online.
  • 19. 19 The eHealth Unit Vale, pero esto solo afecta a Telcos y NSA no? • Gran parte de la construcción de modelos en Big Data para biología es virtual y con un claro foco en ‘cloud computing’. • Una de las herramientas más usadas es el ENSBML genome browser operado de forma conjunta entre EBI y el Wellcome Trust Sanger Institute en Hinxton. Los servidores principales de ENSBML se encuentran en el Reino Unido pero cuando los usuarios de los EEUU y Japon tuvieron dificultades en acceder a los datos, el EBI resolvió el problema contratando servidores ‘espejo’ (mirror sites) en los centros de datos de Amazon Web Services Elastic Compute Cloud (E2C). • Otras plataformas de Cloud Computing comúnmente utilizadas son las de Microsoft Azure o las de Fujitsu Cloud Service (K5). • Las plataformas en la nube son una solución pero también suponen retos importantes. Irónicamente, su proliferación puede suponer también un cuello de botella si los datos acaban en varias nubes y, por lo tanto, tienen que moverse para ser compartidos. A parte, el uso de la nube también supone encomendar datos sensibles a un proveedor remoto.
  • 20. 20 The eHealth Unit Vale, pero esto solo afecta a Telcos y NSA no? O cómo hacer ‘trampas’ en unas elecciones: the Cambridge Analytics Issue
  • 21. 21 The eHealth Unit Vale, pero esto solo afecta a Telcos y NSA no?
  • 22. 22 The eHealth Unit Vale, pero esto solo afecta a Telcos y NSA no?
  • 23. 23 The eHealth Unit Investigación médica a escala fisiológica Biological processes Physiological scale Industrial sector Application domain Molecular biology Genome and physiome Bioinformatics Pharmaceutics Susceptibility to disease Metabolic pathways Targets for intervention Cytology and histology Cell and tissue levels Systems biology Laboratory tests Disease diagnosis Medical imaging Organ level Neuroinformatics Medical informatics Medical equipment & instrumentation Pharmaceutics Anatomical and physiological monitoring Electrophysiological measurement Clinical signs System level Diagnosis, prognosis and screening Out-of-hospital care Level of the individual Ambulatory monitoring for early diagnosis Lifestyle factors Population level Public health informatics Disease protection and prevention
  • 24. 25 The eHealth Unit Estratificación Source: Clayton Christensen, ‘The Innovator´s Prescription’
  • 25. 26 The eHealth Unit Cambio de hábitos? Source: Clayton Christensen, ‘The Innovator´s Prescription’
  • 26. 27 The eHealth Unit Ciclo de vida proyecto Big Data
  • 27. 28 The eHealth Unit Proyecto en el área de salud • Análisis multiómico del shock. - El shock se define como una bajada significativa de la tensión arterial refractaria a la administración de fluidos. - Las principales fuentes de shock son: infección (shock séptico) y disfunción cardiovascular (shock cardiogénico). - La tasa de mortalidad del shock es > 70%.
  • 28. 29 The eHealth Unit Proyecto en el área de salud • Contexto sobre los datos. - Datos de 73 pacientes ingresados en dos UCIs (Bélgica y Ginebra). - Análisis transcriptómico, proteómico y metabolómico a partir de muestras de plasma obtenidas durante la admisión en la UCI, a las 48 h y a los 5 días. - En total, se obtienen ~15000 mRNA, ~5000 proteínas + ~ 5000 péptidos y ~500 metabolitos. En total, 1TB de datos analizados.
  • 29. 30 The eHealth Unit Modelo gráfico resultante
  • 30. 31 The eHealth Unit Algo de rabiosa actualidad • DEEP LEARNING - Aprendizaje imitando el funcionamiento del cerebro humano. - Resumir información - Detección de patrones - Soporte al diagnóstico - Descripción de imágenes - Generación de contenidos - Jugar a ‘Go’