SlideShare una empresa de Scribd logo
1 de 31
Introducción al análisis 
topológico de datos 
en R. (phom) 
Grupo de Interés Local de Madrid – 26 de Noviembre. 
Alfonso de Uña del Brío.
Alfonso de Uña del Brío briofons@gmail.com 
Análisis topológico de datos 
 Es una técnica para el estudio cualitativo de datos. 
 Desarrollada en los últimos 15 años por un grupo de topólogos 
 Gunnar Carlsson 
 Herbert Edelsbrunner 
 Robert Ghrist 
 John L. Harer 
 Afra Zomorodian 
 Objetivo: 
 Aplicar la topología algebraica para obtener técnicas y herramientas que nos 
permitan estudiar las propiedades topológicas y geométricas de un conjunto de 
datos.
Paradigma análisis topológico de los datos 
Se les asocia 
DATOS Estructura topológica 
Alfonso de Uña del Brío briofons@gmail.com 
Propiedades topológicas 
Se 
Retornamos a estudian 
los datos
Alfonso de Uña del Brío briofons@gmail.com 
ATD como herramienta 
 Es una herramienta de análisis de datos meramente heurística. 
 Rama muy nueva dentro del desarrollo de la teoría de probabilidad y estadística. 
 Probabilidad en espacios de Banach 
 Topología estocástica 
 Inferencia estadística para homología persistente 
 Tiene aplicaciones muy concretas en contextos muy variados
En busca de estructuras en los conjunto de datos 
• A partir de un conjunto de datos queremos obtener información sobre que estructura forma en el 
Alfonso de Uña del Brío briofons@gmail.com 
espacio. 
• Uso de la topología no depende de la geometría sino de las propiedades invariantes
Alfonso de Uña del Brío briofons@gmail.com 
Topología de análisis de datos. 
 Análisis topológico de datos según Carlsson: 
 Como inferir estructuras de grandes dimensiones desde otras con dimensiones 
menores 
 Como crear una estructura global desde un conjunto de puntos discretos. 
 Está basado en como nuestro cerebro infiere la información del mundo que nos 
rodea. 
 Ejemplo: el ojo como aparato óptico es bastante malo es gracias a nuestro cerebro 
que a partir de las formas vagas que nos llegan infiere el mundo tal y como lo 
entendemos (visualización en 3d).
Concepto Matemático: Homología persistente 
Alfonso de Uña del Brío briofons@gmail.com 
 Homología persistente: 
 Estructura topológica: Complejos simpliciales. 
 Propiedades topológicas: Grupos de homología, números de Betti.
Alfonso de Uña del Brío briofons@gmail.com 
Complejos simpliciales
Alfonso de Uña del Brío briofons@gmail.com 
Propiedades topológicas 
Tenemos una serie de 
propiedades topológicas que se 
van formando a medida que el 
radio de los puntos van 
creciendo. 
Cada una de estas propiedades 
tiene un tiempo de vida, será 
interesante para el estudio de los 
datos. (Detección de ruido).
Alfonso de Uña del Brío briofons@gmail.com 
Números de Betti
Alfonso de Uña del Brío briofons@gmail.com 
Homología persistente 
 Descripción matemática: 
 La teoría de la homología persistente crea la homología simplicial desde el algebra 
topológica, donde la homología simplicial define un conjunto de invariantes 
topológicos de complejos simpliciales con los que se puede describir las 
características topológicas de las formas… 
 Gunnar Carlsson, Topology and data, Bulletin of the American Mathematical Society 46 (2009), noº2, 255–308.
Alfonso de Uña del Brío briofons@gmail.com 
Homología de persistencia 
 Dada una nube de puntos X {x1,x2,x3,…} queremos obtener información sobre la 
forma de estos puntos en el espacio. Además permite la descomposición 
multidimensional de las características topológicas de nuestro conjunto de datos 
 Relativamente nueva que se está incorporando cada vez más a diferentes campos 
de investigación. (En problemas concretos) 
 Ecología 
 Genética 
 Procesamiento de imágenes 
 Visión artificial (Reconocimiento de objetos en 3D) 
 Redes de sensores 
 Machine Learning
Pasos para construer un código de barras 
Alfonso de Uña del Brío briofons@gmail.com 
Step 1 
Inicio 
• Nube de 
puntos 
Step 2 
Complejos 
Simpliciales 
• Parámetro 
radio 
Step 3 
homología 
• Construir 
homología 
persistente 
Step 4 
Construir 
Barcode 
• Basado nº 
Betti
Creación de un código de barras a través de complejos 
simpliciales 
Alfonso de Uña del Brío briofons@gmail.com
Alfonso de Uña del Brío briofons@gmail.com 
Vídeo creación de código de barras
Paquete “pHom”: Persistent Homology in R 
 Es un paquete de R para generar la homología persistente de conjunto de datos 
en el espacio. 
 La homología persistente es una herramienta algebraica que permite acceder a 
propiedades topológicas de un conjunto de datos dados en varias dimensiones. 
 Clustering de las propiedades homológicas de los datos en muchas dimensiones. 
Version: 1.0.3 
Depends: Rcpp (≥ 0.9.7) 
LinkingTo: Rcpp 
Published: 2014-02-09 
Author: Andrew Tausz 
Maintainer: Andrew Tausz <atausz at stanford.edu> 
License: BSD_3_clause + file LICENSE 
Alfonso de Uña del Brío briofons@gmail.com
Alfonso de Uña del Brío briofons@gmail.com 
Paquete “pHom” 
> intervals <- pHom(X, max_dim, max_f, metric = "manhattan") 
 Función que genera los intervalos de cada clase en cada dimensión hasta los límites que nos 
interese, solo se le puede pasar le valor máximo de la filtración (épsilon - radio). 
 Dos modos de filtración (rips y …) 
 Nos devuelve una matriz con tres columnas con dimensión inicio y fin
Alfonso de Uña del Brío briofons@gmail.com 
Ejemplo 
library(phom) 
x <- runif(100) 
y <- runif(100) 
points <- t(as.matrix(rbind(x, y))) 
max_dim <- 2 
max_f <- 0.2 
#Obtención de los intervalos inicio fin 
intervals <- pHom(points, max_dim, max_f, metric="manhattan") 
#diagrama de persistencia 
plotPersistenceDiagram(intervals, max_dim, max_f, 
title="Random Points in Cube with l_1 Norm")
Alfonso de Uña del Brío briofons@gmail.com 
Ejemplo: Diagrama de persistencia 
 El diagrama de persistencia sería el siguiente: 
 Observamos más lazos de dimensión uno
Alfonso de Uña del Brío briofons@gmail.com 
Ejemplo 
library(phom) 
N <- 50 
x1 <- rnorm(N) * 0.1 
y1 <- rnorm(N) * 0.1 
X1 <- t(as.matrix(rbind(x1, y1))) 
x2 <- rnorm(N) * 0.1 + 0.5 
y2 <- rnorm(N) * 0.1 + 0.5 
X2 <- t(as.matrix(rbind(x2, y2))) 
x <- cbind(x1, x2) 
y <- cbind(y1, y2) 
X <- as.matrix(rbind(X1, X2)) 
max_dim <- 0 
max_f <- 0.8 
intervals <- pHom(X, max_dim, max_f, metric = 
"manhattan")
Alfonso de Uña del Brío briofons@gmail.com 
Ejemplo de Código de barras 
plotBarcodeDiagram(intervals, max_dim, max_f, title = "")
Alfonso de Uña del Brío briofons@gmail.com 
Ejemplo 
t <- 2 * pi * runif(100) Diagrama de persistencia 
x <- cos(t); y <- sin(t) plotPersistenceDiagram() 
X <- t(as.matrix(rbind(x, y)))
Alfonso de Uña del Brío briofons@gmail.com 
Interpretación del código de barras 
https://dreamtolearn.com/ryan/data_analytics_viz/50
Alfonso de Uña del Brío briofons@gmail.com 
Interpretación del código de barras
Una vez obtenido un código de barras… 
Alfonso de Uña del Brío briofons@gmail.com 
 ¿Y ahora qué? 
 Tenemos que interpretar el código de barras en nuestro estudio. 
 ¿Qué significa tener agujeros de dimensión dos en nuestros datos? 
 Interpretar las diferencias topológicas de diferentes espacios. 
 Interpretar las modificaciones de las propiedades en el tiempo con nuestro conjunto de 
datos. 
 Cuándo es útil utilizar ATD (TAD): 
 Capacidad para manejar gran cantidad de datos computacionalmente. 
 Seremos capaces de detectar una estructuras globales con ruido en nuestros datos. 
 Podemos descubrir patrones ocultos en los datos y buscar tales patrones dentro de 
un conjunto mayor de datos o otros datos dentro del mismo contexto.
Estructura global de una nube de puntos 
Alfonso de Uña del Brío briofons@gmail.com 
http://www.ams.org/journals/bull/2008-45-01/S0273-0979-07- 
01191-3/S0273-0979-07-01191-3.pdf 
BARCODES
Alfonso de Uña del Brío briofons@gmail.com 
Interpretación en el espacio biológico
Alfonso de Uña del Brío briofons@gmail.com 
Interpretación en el espacio biológico 
TDA en nichos ecológicos. Vidal Allí
Alfonso de Uña del Brío briofons@gmail.com 
Bibliografía 
 Conferencia "TDA y Genética", José María Ibarra Rodríguez 
 https://www.youtube.com/watch?v=c7pZpTvpLTY 
 Conferencia "TDA en nichos ecológicos", Vidal Alí 
 https://www.youtube.com/watch?v=EZibw3cdcyw 
 Conferencia "TDA, Persistent homology", Dr. José Antonio de la Peña 
 https://www.youtube.com/watch?v=sB2kA46ALNE 
 http://cran.r-project.org/web/packages/phom/vignettes/phom.pdf 
 Barcodes: The persistent topology of data 
 http://www.math.upenn.edu/~ghrist/preprints/barcodes.pdf
Alfonso de Uña del Brío briofons@gmail.com 
Bibliografía 
 Topological Data Analysis 
 http://www.cs.dartmouth.edu/~afra/papers/ams12/tda.pdf (Afra Zomorodian) 
 Computational Topology and Data Analysis 
 http://web.cse.ohio-state.edu/~tamaldey/course/CTDA/CTDA.html 
 Topology and data (Gunnar Carlsson) 
 http://www.ams.org/journals/bull/2009-46-02/S0273-0979-09-01249-X/
Introducción al análisis topológico de datos con R (phom)

Más contenido relacionado

La actualidad más candente

Probabilidad y Eventos
Probabilidad y EventosProbabilidad y Eventos
Probabilidad y EventosJose Arteaga
 
Capitulo iii cinematica de una particula(1)
Capitulo iii cinematica de una particula(1)Capitulo iii cinematica de una particula(1)
Capitulo iii cinematica de una particula(1)Oscar Eduardo Jorge Nina
 
Thomas kuhn y Las Revoluciones Cientificas
Thomas kuhn y Las Revoluciones CientificasThomas kuhn y Las Revoluciones Cientificas
Thomas kuhn y Las Revoluciones CientificasDiana Rojas
 
Diseño y construcción de un prototipo de la primera Ley de Newton
Diseño y construcción de un prototipo de la primera Ley de NewtonDiseño y construcción de un prototipo de la primera Ley de Newton
Diseño y construcción de un prototipo de la primera Ley de NewtonALEJANDRANAYELIPANCH
 
Un papel para la
Un papel para laUn papel para la
Un papel para laariasandi10
 
3. movimiento rectilíneo
3. movimiento rectilíneo3. movimiento rectilíneo
3. movimiento rectilíneomjrunah
 
Ejercicios de cinemática
Ejercicios de cinemáticaEjercicios de cinemática
Ejercicios de cinemáticaCarlomar13894
 
Prototipos Francisco José de Caldas
Prototipos Francisco José de CaldasPrototipos Francisco José de Caldas
Prototipos Francisco José de CaldasNATALIACASTELLANOSGO1
 
Estadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pg
Estadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pgEstadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pg
Estadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pgvictor chacon
 
Contexto histórico de la rigorización de las matemáticas y crisis de los fund...
Contexto histórico de la rigorización de las matemáticas y crisis de los fund...Contexto histórico de la rigorización de las matemáticas y crisis de los fund...
Contexto histórico de la rigorización de las matemáticas y crisis de los fund...ElizabethDavidGmez
 
Muestreo por cuotas. .pptx
Muestreo por cuotas. .pptxMuestreo por cuotas. .pptx
Muestreo por cuotas. .pptxRuben Tobar
 

La actualidad más candente (20)

geometría analítica
geometría analítica geometría analítica
geometría analítica
 
Probabilidad y Eventos
Probabilidad y EventosProbabilidad y Eventos
Probabilidad y Eventos
 
Probabilidades
ProbabilidadesProbabilidades
Probabilidades
 
Capitulo iii cinematica de una particula(1)
Capitulo iii cinematica de una particula(1)Capitulo iii cinematica de una particula(1)
Capitulo iii cinematica de una particula(1)
 
Thomas kuhn y Las Revoluciones Cientificas
Thomas kuhn y Las Revoluciones CientificasThomas kuhn y Las Revoluciones Cientificas
Thomas kuhn y Las Revoluciones Cientificas
 
escuela de frankfurt
escuela de frankfurtescuela de frankfurt
escuela de frankfurt
 
Diseño y construcción de un prototipo de la primera Ley de Newton
Diseño y construcción de un prototipo de la primera Ley de NewtonDiseño y construcción de un prototipo de la primera Ley de Newton
Diseño y construcción de un prototipo de la primera Ley de Newton
 
HISTORIA DEL CALCULO INFINITESIMAL.pdf
HISTORIA DEL CALCULO INFINITESIMAL.pdfHISTORIA DEL CALCULO INFINITESIMAL.pdf
HISTORIA DEL CALCULO INFINITESIMAL.pdf
 
Un papel para la
Un papel para laUn papel para la
Un papel para la
 
Taller de vectores 2
Taller de vectores 2Taller de vectores 2
Taller de vectores 2
 
3. movimiento rectilíneo
3. movimiento rectilíneo3. movimiento rectilíneo
3. movimiento rectilíneo
 
Ejercicios de cinemática
Ejercicios de cinemáticaEjercicios de cinemática
Ejercicios de cinemática
 
Prototipos Francisco José de Caldas
Prototipos Francisco José de CaldasPrototipos Francisco José de Caldas
Prototipos Francisco José de Caldas
 
Estadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pg
Estadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pgEstadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pg
Estadistica descriptiva-manuel-cordova-zamora-pdf libro 518 pg
 
Obstáculos epistemológicos
Obstáculos epistemológicosObstáculos epistemológicos
Obstáculos epistemológicos
 
Epistemologia
EpistemologiaEpistemologia
Epistemologia
 
Estadística
EstadísticaEstadística
Estadística
 
Contexto histórico de la rigorización de las matemáticas y crisis de los fund...
Contexto histórico de la rigorización de las matemáticas y crisis de los fund...Contexto histórico de la rigorización de las matemáticas y crisis de los fund...
Contexto histórico de la rigorización de las matemáticas y crisis de los fund...
 
Muestreo por cuotas. .pptx
Muestreo por cuotas. .pptxMuestreo por cuotas. .pptx
Muestreo por cuotas. .pptx
 
14776451 reacciones-redox
14776451 reacciones-redox14776451 reacciones-redox
14776451 reacciones-redox
 

Destacado

Enseñanza de la probabilidad y estadística con herramientas online sara silv...
Enseñanza de la probabilidad y estadística con herramientas online  sara silv...Enseñanza de la probabilidad y estadística con herramientas online  sara silv...
Enseñanza de la probabilidad y estadística con herramientas online sara silv...sarasilvah
 
Presentacion Probabilidades Y Estadistica
Presentacion Probabilidades Y EstadisticaPresentacion Probabilidades Y Estadistica
Presentacion Probabilidades Y Estadisticareny.hernandez
 
Introduccion a la Probabilidad y Estadística
Introduccion a la Probabilidad y EstadísticaIntroduccion a la Probabilidad y Estadística
Introduccion a la Probabilidad y Estadísticajoraroyn
 
Presentación de Probabilidad y Estadística 2011
Presentación de Probabilidad y Estadística 2011Presentación de Probabilidad y Estadística 2011
Presentación de Probabilidad y Estadística 2011Baggyra
 
Probabilidad & estadistica
Probabilidad & estadisticaProbabilidad & estadistica
Probabilidad & estadisticaCesar1612
 
El Proyecto de investigación. marco teórico Diapositivas Investigación Cient...
 El Proyecto de investigación. marco teórico Diapositivas Investigación Cient... El Proyecto de investigación. marco teórico Diapositivas Investigación Cient...
El Proyecto de investigación. marco teórico Diapositivas Investigación Cient...César Calizaya
 
Cómo elaborar un marco teórico
Cómo elaborar un marco teóricoCómo elaborar un marco teórico
Cómo elaborar un marco teóricoSasNoizemaker
 
Paso a Paso para construir un marco teórico
 Paso a Paso para construir un marco teórico Paso a Paso para construir un marco teórico
Paso a Paso para construir un marco teóricoJosé Davidd Meza
 

Destacado (9)

Enseñanza de la probabilidad y estadística con herramientas online sara silv...
Enseñanza de la probabilidad y estadística con herramientas online  sara silv...Enseñanza de la probabilidad y estadística con herramientas online  sara silv...
Enseñanza de la probabilidad y estadística con herramientas online sara silv...
 
Presentacion Probabilidades Y Estadistica
Presentacion Probabilidades Y EstadisticaPresentacion Probabilidades Y Estadistica
Presentacion Probabilidades Y Estadistica
 
Introduccion a la Probabilidad y Estadística
Introduccion a la Probabilidad y EstadísticaIntroduccion a la Probabilidad y Estadística
Introduccion a la Probabilidad y Estadística
 
Presentación de Probabilidad y Estadística 2011
Presentación de Probabilidad y Estadística 2011Presentación de Probabilidad y Estadística 2011
Presentación de Probabilidad y Estadística 2011
 
Probabilidad y Estadistica
Probabilidad y EstadisticaProbabilidad y Estadistica
Probabilidad y Estadistica
 
Probabilidad & estadistica
Probabilidad & estadisticaProbabilidad & estadistica
Probabilidad & estadistica
 
El Proyecto de investigación. marco teórico Diapositivas Investigación Cient...
 El Proyecto de investigación. marco teórico Diapositivas Investigación Cient... El Proyecto de investigación. marco teórico Diapositivas Investigación Cient...
El Proyecto de investigación. marco teórico Diapositivas Investigación Cient...
 
Cómo elaborar un marco teórico
Cómo elaborar un marco teóricoCómo elaborar un marco teórico
Cómo elaborar un marco teórico
 
Paso a Paso para construir un marco teórico
 Paso a Paso para construir un marco teórico Paso a Paso para construir un marco teórico
Paso a Paso para construir un marco teórico
 

Similar a Introducción al análisis topológico de datos con R (phom)

Microsoft power point curso-2006_sesion2_kohonen
Microsoft power point   curso-2006_sesion2_kohonenMicrosoft power point   curso-2006_sesion2_kohonen
Microsoft power point curso-2006_sesion2_kohonenaskroll
 
Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...
Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...
Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...jorgeybotana
 
Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...
Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...
Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...RootedCON
 
Memética en la mente de SmartLab
Memética en la mente de SmartLabMemética en la mente de SmartLab
Memética en la mente de SmartLabJoseba Abaitua
 
Gestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y RGestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y RFrancisco Palm
 
UN ACERCAMIENTO A LA GEOMETRÍA FRACTAL
UN ACERCAMIENTO A LA GEOMETRÍA  FRACTALUN ACERCAMIENTO A LA GEOMETRÍA  FRACTAL
UN ACERCAMIENTO A LA GEOMETRÍA FRACTALMoises Logroño
 
Apuntes cobat-19 fabiola
Apuntes cobat-19    fabiolaApuntes cobat-19    fabiola
Apuntes cobat-19 fabiolapastura
 
Representacion de la información en las computadoras
Representacion de la información en las computadorasRepresentacion de la información en las computadoras
Representacion de la información en las computadoraspanama
 
PRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptx
PRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptxPRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptx
PRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptxjuliocalvo18
 
Páginas desde teoinfo(1 14)
Páginas desde teoinfo(1 14)Páginas desde teoinfo(1 14)
Páginas desde teoinfo(1 14)Santiago Acurio
 
Apunte de cátedra_Tecnología de la información.pdf
Apunte de cátedra_Tecnología de la información.pdfApunte de cátedra_Tecnología de la información.pdf
Apunte de cátedra_Tecnología de la información.pdfadcarolarte
 
Sistemas Numéricos y Conversiones
Sistemas Numéricos y Conversiones Sistemas Numéricos y Conversiones
Sistemas Numéricos y Conversiones MoisesDeLeon7
 
Generación procedimental de contenido (+ Pseudocódigo)
Generación procedimental de contenido (+ Pseudocódigo)Generación procedimental de contenido (+ Pseudocódigo)
Generación procedimental de contenido (+ Pseudocódigo)Federico Peinado
 
Machote de programación
Machote de programaciónMachote de programación
Machote de programaciónMauren Herrera
 

Similar a Introducción al análisis topológico de datos con R (phom) (20)

Microsoft power point curso-2006_sesion2_kohonen
Microsoft power point   curso-2006_sesion2_kohonenMicrosoft power point   curso-2006_sesion2_kohonen
Microsoft power point curso-2006_sesion2_kohonen
 
Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...
Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...
Variantes a la extracción de vecinos semánticos y al algoritmo de predicacció...
 
Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...
Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...
Alfonso Muñoz – Ocultación de comunicaciones en lenguaje natural [Rooted CON ...
 
Memética en la mente de SmartLab
Memética en la mente de SmartLabMemética en la mente de SmartLab
Memética en la mente de SmartLab
 
Diseño de información
Diseño de informaciónDiseño de información
Diseño de información
 
Gestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y RGestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y R
 
UN ACERCAMIENTO A LA GEOMETRÍA FRACTAL
UN ACERCAMIENTO A LA GEOMETRÍA  FRACTALUN ACERCAMIENTO A LA GEOMETRÍA  FRACTAL
UN ACERCAMIENTO A LA GEOMETRÍA FRACTAL
 
Apuntes cobat-19 fabiola
Apuntes cobat-19    fabiolaApuntes cobat-19    fabiola
Apuntes cobat-19 fabiola
 
Representacion de la información en las computadoras
Representacion de la información en las computadorasRepresentacion de la información en las computadoras
Representacion de la información en las computadoras
 
PRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptx
PRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptxPRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptx
PRESENTACIÓN DE INGENIERÍA ELECTRONICA UNIDAD DIDÁCTICA MULTIMEDIA N°5.pptx
 
Exposición spring
Exposición springExposición spring
Exposición spring
 
Páginas desde teoinfo(1 14)
Páginas desde teoinfo(1 14)Páginas desde teoinfo(1 14)
Páginas desde teoinfo(1 14)
 
Mod i, sub 2 gest archdispofim 4
Mod i, sub 2 gest archdispofim   4Mod i, sub 2 gest archdispofim   4
Mod i, sub 2 gest archdispofim 4
 
Apunte de cátedra_Tecnología de la información.pdf
Apunte de cátedra_Tecnología de la información.pdfApunte de cátedra_Tecnología de la información.pdf
Apunte de cátedra_Tecnología de la información.pdf
 
2014 ii c04t-quipus
2014 ii c04t-quipus2014 ii c04t-quipus
2014 ii c04t-quipus
 
Sistemas Numéricos y Conversiones
Sistemas Numéricos y Conversiones Sistemas Numéricos y Conversiones
Sistemas Numéricos y Conversiones
 
Generación procedimental de contenido (+ Pseudocódigo)
Generación procedimental de contenido (+ Pseudocódigo)Generación procedimental de contenido (+ Pseudocódigo)
Generación procedimental de contenido (+ Pseudocódigo)
 
Logica difusa
Logica difusaLogica difusa
Logica difusa
 
Machote de programación
Machote de programaciónMachote de programación
Machote de programación
 
Taller
TallerTaller
Taller
 

Último

Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405rodrimarxim
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptxccordovato
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería yocelynsanchezerasmo
 
stellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino morastellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino moraYessicaBrigithArdila
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILPREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILeluniversocom
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoSantiagoRodriguezLoz
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotessald071205mmcnrna9
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Ivie
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docxmarthaarroyo16
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdfCamilaArzate2
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxYoladsCabarcasTous
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfhernestosoto82
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptxKatherineFabianLoza1
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024eluniversocom
 

Último (20)

Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería
 
stellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino morastellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino mora
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
 
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILPREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotes
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptx
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdf
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
 

Introducción al análisis topológico de datos con R (phom)

  • 1. Introducción al análisis topológico de datos en R. (phom) Grupo de Interés Local de Madrid – 26 de Noviembre. Alfonso de Uña del Brío.
  • 2. Alfonso de Uña del Brío briofons@gmail.com Análisis topológico de datos  Es una técnica para el estudio cualitativo de datos.  Desarrollada en los últimos 15 años por un grupo de topólogos  Gunnar Carlsson  Herbert Edelsbrunner  Robert Ghrist  John L. Harer  Afra Zomorodian  Objetivo:  Aplicar la topología algebraica para obtener técnicas y herramientas que nos permitan estudiar las propiedades topológicas y geométricas de un conjunto de datos.
  • 3. Paradigma análisis topológico de los datos Se les asocia DATOS Estructura topológica Alfonso de Uña del Brío briofons@gmail.com Propiedades topológicas Se Retornamos a estudian los datos
  • 4. Alfonso de Uña del Brío briofons@gmail.com ATD como herramienta  Es una herramienta de análisis de datos meramente heurística.  Rama muy nueva dentro del desarrollo de la teoría de probabilidad y estadística.  Probabilidad en espacios de Banach  Topología estocástica  Inferencia estadística para homología persistente  Tiene aplicaciones muy concretas en contextos muy variados
  • 5. En busca de estructuras en los conjunto de datos • A partir de un conjunto de datos queremos obtener información sobre que estructura forma en el Alfonso de Uña del Brío briofons@gmail.com espacio. • Uso de la topología no depende de la geometría sino de las propiedades invariantes
  • 6. Alfonso de Uña del Brío briofons@gmail.com Topología de análisis de datos.  Análisis topológico de datos según Carlsson:  Como inferir estructuras de grandes dimensiones desde otras con dimensiones menores  Como crear una estructura global desde un conjunto de puntos discretos.  Está basado en como nuestro cerebro infiere la información del mundo que nos rodea.  Ejemplo: el ojo como aparato óptico es bastante malo es gracias a nuestro cerebro que a partir de las formas vagas que nos llegan infiere el mundo tal y como lo entendemos (visualización en 3d).
  • 7. Concepto Matemático: Homología persistente Alfonso de Uña del Brío briofons@gmail.com  Homología persistente:  Estructura topológica: Complejos simpliciales.  Propiedades topológicas: Grupos de homología, números de Betti.
  • 8. Alfonso de Uña del Brío briofons@gmail.com Complejos simpliciales
  • 9. Alfonso de Uña del Brío briofons@gmail.com Propiedades topológicas Tenemos una serie de propiedades topológicas que se van formando a medida que el radio de los puntos van creciendo. Cada una de estas propiedades tiene un tiempo de vida, será interesante para el estudio de los datos. (Detección de ruido).
  • 10. Alfonso de Uña del Brío briofons@gmail.com Números de Betti
  • 11. Alfonso de Uña del Brío briofons@gmail.com Homología persistente  Descripción matemática:  La teoría de la homología persistente crea la homología simplicial desde el algebra topológica, donde la homología simplicial define un conjunto de invariantes topológicos de complejos simpliciales con los que se puede describir las características topológicas de las formas…  Gunnar Carlsson, Topology and data, Bulletin of the American Mathematical Society 46 (2009), noº2, 255–308.
  • 12. Alfonso de Uña del Brío briofons@gmail.com Homología de persistencia  Dada una nube de puntos X {x1,x2,x3,…} queremos obtener información sobre la forma de estos puntos en el espacio. Además permite la descomposición multidimensional de las características topológicas de nuestro conjunto de datos  Relativamente nueva que se está incorporando cada vez más a diferentes campos de investigación. (En problemas concretos)  Ecología  Genética  Procesamiento de imágenes  Visión artificial (Reconocimiento de objetos en 3D)  Redes de sensores  Machine Learning
  • 13. Pasos para construer un código de barras Alfonso de Uña del Brío briofons@gmail.com Step 1 Inicio • Nube de puntos Step 2 Complejos Simpliciales • Parámetro radio Step 3 homología • Construir homología persistente Step 4 Construir Barcode • Basado nº Betti
  • 14. Creación de un código de barras a través de complejos simpliciales Alfonso de Uña del Brío briofons@gmail.com
  • 15. Alfonso de Uña del Brío briofons@gmail.com Vídeo creación de código de barras
  • 16. Paquete “pHom”: Persistent Homology in R  Es un paquete de R para generar la homología persistente de conjunto de datos en el espacio.  La homología persistente es una herramienta algebraica que permite acceder a propiedades topológicas de un conjunto de datos dados en varias dimensiones.  Clustering de las propiedades homológicas de los datos en muchas dimensiones. Version: 1.0.3 Depends: Rcpp (≥ 0.9.7) LinkingTo: Rcpp Published: 2014-02-09 Author: Andrew Tausz Maintainer: Andrew Tausz <atausz at stanford.edu> License: BSD_3_clause + file LICENSE Alfonso de Uña del Brío briofons@gmail.com
  • 17. Alfonso de Uña del Brío briofons@gmail.com Paquete “pHom” > intervals <- pHom(X, max_dim, max_f, metric = "manhattan")  Función que genera los intervalos de cada clase en cada dimensión hasta los límites que nos interese, solo se le puede pasar le valor máximo de la filtración (épsilon - radio).  Dos modos de filtración (rips y …)  Nos devuelve una matriz con tres columnas con dimensión inicio y fin
  • 18. Alfonso de Uña del Brío briofons@gmail.com Ejemplo library(phom) x <- runif(100) y <- runif(100) points <- t(as.matrix(rbind(x, y))) max_dim <- 2 max_f <- 0.2 #Obtención de los intervalos inicio fin intervals <- pHom(points, max_dim, max_f, metric="manhattan") #diagrama de persistencia plotPersistenceDiagram(intervals, max_dim, max_f, title="Random Points in Cube with l_1 Norm")
  • 19. Alfonso de Uña del Brío briofons@gmail.com Ejemplo: Diagrama de persistencia  El diagrama de persistencia sería el siguiente:  Observamos más lazos de dimensión uno
  • 20. Alfonso de Uña del Brío briofons@gmail.com Ejemplo library(phom) N <- 50 x1 <- rnorm(N) * 0.1 y1 <- rnorm(N) * 0.1 X1 <- t(as.matrix(rbind(x1, y1))) x2 <- rnorm(N) * 0.1 + 0.5 y2 <- rnorm(N) * 0.1 + 0.5 X2 <- t(as.matrix(rbind(x2, y2))) x <- cbind(x1, x2) y <- cbind(y1, y2) X <- as.matrix(rbind(X1, X2)) max_dim <- 0 max_f <- 0.8 intervals <- pHom(X, max_dim, max_f, metric = "manhattan")
  • 21. Alfonso de Uña del Brío briofons@gmail.com Ejemplo de Código de barras plotBarcodeDiagram(intervals, max_dim, max_f, title = "")
  • 22. Alfonso de Uña del Brío briofons@gmail.com Ejemplo t <- 2 * pi * runif(100) Diagrama de persistencia x <- cos(t); y <- sin(t) plotPersistenceDiagram() X <- t(as.matrix(rbind(x, y)))
  • 23. Alfonso de Uña del Brío briofons@gmail.com Interpretación del código de barras https://dreamtolearn.com/ryan/data_analytics_viz/50
  • 24. Alfonso de Uña del Brío briofons@gmail.com Interpretación del código de barras
  • 25. Una vez obtenido un código de barras… Alfonso de Uña del Brío briofons@gmail.com  ¿Y ahora qué?  Tenemos que interpretar el código de barras en nuestro estudio.  ¿Qué significa tener agujeros de dimensión dos en nuestros datos?  Interpretar las diferencias topológicas de diferentes espacios.  Interpretar las modificaciones de las propiedades en el tiempo con nuestro conjunto de datos.  Cuándo es útil utilizar ATD (TAD):  Capacidad para manejar gran cantidad de datos computacionalmente.  Seremos capaces de detectar una estructuras globales con ruido en nuestros datos.  Podemos descubrir patrones ocultos en los datos y buscar tales patrones dentro de un conjunto mayor de datos o otros datos dentro del mismo contexto.
  • 26. Estructura global de una nube de puntos Alfonso de Uña del Brío briofons@gmail.com http://www.ams.org/journals/bull/2008-45-01/S0273-0979-07- 01191-3/S0273-0979-07-01191-3.pdf BARCODES
  • 27. Alfonso de Uña del Brío briofons@gmail.com Interpretación en el espacio biológico
  • 28. Alfonso de Uña del Brío briofons@gmail.com Interpretación en el espacio biológico TDA en nichos ecológicos. Vidal Allí
  • 29. Alfonso de Uña del Brío briofons@gmail.com Bibliografía  Conferencia "TDA y Genética", José María Ibarra Rodríguez  https://www.youtube.com/watch?v=c7pZpTvpLTY  Conferencia "TDA en nichos ecológicos", Vidal Alí  https://www.youtube.com/watch?v=EZibw3cdcyw  Conferencia "TDA, Persistent homology", Dr. José Antonio de la Peña  https://www.youtube.com/watch?v=sB2kA46ALNE  http://cran.r-project.org/web/packages/phom/vignettes/phom.pdf  Barcodes: The persistent topology of data  http://www.math.upenn.edu/~ghrist/preprints/barcodes.pdf
  • 30. Alfonso de Uña del Brío briofons@gmail.com Bibliografía  Topological Data Analysis  http://www.cs.dartmouth.edu/~afra/papers/ams12/tda.pdf (Afra Zomorodian)  Computational Topology and Data Analysis  http://web.cse.ohio-state.edu/~tamaldey/course/CTDA/CTDA.html  Topology and data (Gunnar Carlsson)  http://www.ams.org/journals/bull/2009-46-02/S0273-0979-09-01249-X/