SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
An´alisis de Datos Funcionales para Gesti´on de Red
T´ecnicas, Retos y Oportunidades
David Muelas, Jorge E. L´opez de Vergara,
Jos´e R. Berrendero, Javier Aracil
{dav.muelas, jorge.lopez vergara,
joser.berrendero, javier.aracil}@uam.es
Universidad Aut´onoma de Madrid
JITEL 2015 – Octubre de 2015
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Contenidos
1 Introducci´on
Motivaci´on
¿Qu´e proponemos?
2 Antecedentes
Principios
Emplazamiento de nuestro trabajo
3 T´ecnicas funcionales exploradas y resultados experimentales
Preprocesado de datos de red
An´alisis de datos de red
4 Conclusiones
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 2
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Motivaci´on
¿Qu´e proponemos?
Contexto
Las infraestructuras de red est´an inmersas en un continuo cambio:
Redes Definidas por Software – Software Defined Networking
(SDN)
Infraestructuras Multitenant / Cloud
Redes virtualizadas
. . .
y tambi´en estamos viviendo la transformaci´on de los procesos de
an´alisis de datos:
Era del Big Data: aumento del volumen de datos y de la
capacidad de c´omputo
Flujos de datos y procesos orientados a extraer conocimiento
de datos en crudo
. . .
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 3
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Motivaci´on
¿Qu´e proponemos?
Una ventana de oportunidad
Explotar nuevas estrategias, recursos de computaci´on y sinergias
entre distintos campos de la ciencia y la tecnolog´ıa puede ayudar a
mejorar las acciones de gesti´on.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 4
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Motivaci´on
¿Qu´e proponemos?
Nuestra propuesta
Aprovechar los avances en el An´alisis de Datos Funcionales
(Functional Data Analysis, FDA), para estudiar y explotar diversos
datos procedentes de medidas de red.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 5
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Motivaci´on
¿Qu´e proponemos?
Nuestras aportaciones
Proporcionamos una revisi´on de los antecedentes que motivan
nuestra propuesta.
Revisamos distintas t´ecnicas de FDA, con el fin de ofrecer un
cat´alogo de t´ecnicas para investigadores y profesionales del
´area de Ingenier´ıa Telem´atica.
Evaluamos las ganancias que se pueden obtener en la gesti´on
de red mediante la aplicaci´on de FDA.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 6
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Principios
Emplazamiento de nuestro trabajo
Direcciones en la gesti´on de red
FDA permite extender y explotar muchos de los principios que
presentan las ´ultimas herramientas y soluciones de monitorizaci´on
y an´alisis de redes:
Flexibilidad y adaptabilidad: sistemas modulares, m´etodos
que se ajusten a las caracter´ısticas concretas de cada entorno.
Conocimiento y datos: extracci´on de conocimiento a partir
de datos y medidas.
Explotaci´on de la capacidad de c´omputo disponible:
estudios complejos, sin miedo a la alta dimensionalidad.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 7
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Principios
Emplazamiento de nuestro trabajo
Integraci´on en el estado de la t´ecnica
Despliegue e implementaci´on: implementaciones libres de
FDA en R o MATLAB, posible incluir estas t´ecnicas en sistemas
como Scap, Blockmon, M3Omon,. . .
Antecedentes en la literatura: eigenflows, para estudio de
anomal´ıas y caracterizaci´on del comportamiento de la red;
an´alisis multi-resoluci´on,. . .
Mayor riqueza en los modelos de red: FDA permite
incrementar la dimensionalidad de los modelos de red,
proporcionando mayor riqueza que an´alisis multivariantes, y
relajando algunas hip´otesis de las t´ecnicas cl´asicas.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 8
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
Representaci´on funcional: formulaci´on anal´ıtica
Base funcional: {Bk(t)}t∈T,k∈Z
Proyecciones: {βk}k∈Z
Observaciones:
{Xt} =
j∈Z
βj Bj (t), t ∈ T
Representaci´on truncada:
{Xt} = [
j∈J
βj Bj (t)] + (J, {Bj }), t ∈ T
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 9
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
PCA funcional (I)
Permite seleccionar una base funcional para representar de forma
´optima el conjunto de observaciones considerado.
0 50 100 150 200 250
−0.3
−0.2
−0.1
0
0.1
0.2
0.3
0.4
Tiempo desde el comienzo [Ventanas de 300 s]
Figura: Comportamiento de las 30 primeras componentes principales
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 10
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
PCA funcional (II)
El estudio de los coeficientes de las observaciones con respecto a
esta base permite detectar clusters y clasificar curvas:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
−4
−2
0
2
4
6
8
10
12
x 10
6
Componente principal correspondiente
Densidaddecoeficientes
Cluster 2
Cluster 1
Figura: Densidad de los coeficientes por componente principal
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 11
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
PCA funcional (III)
Este preprocesado se puede utilizar como mecanismo de
compresi´on:
0 50 100 150 200 250
0
2
4
6
8
10
x 10
5
Tiempo desde el comienzo [Ventanas de 300 s]
Throughput[Bps]
0 50 100 150 200 250
0
2
4
6
8
10
x 10
5
Figura: Comparativa entre las observaciones originales (superior) y las
series reconstruidas (inferior) tras el preprocesado de los datos.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 12
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
Profundidad funcional (I)
No existe una noci´on ´unica de profundidad, sino que se trata
de un concepto que se define en base a ciertas propiedades de
centralidad de las observaciones.
En nuestro caso, vamos a seguir la definici´on dada por la
expresi´on
MSn,H(x) = m´ın{SLn(x), ILn(x)}
donde
SLn(x) = 1
nλ(I)
n
i=1
λ{t ∈ T : x(t) ≤ xi (t)}
ILn(x) = 1
nλ(I)
n
i=1
λ{t ∈ T : x(t) ≥ xi (t)}
siendo λ la medida de Lebesgue.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 13
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
Profundidad funcional (II)
Con esta definici´on, estamos ordenando las observaciones usando el
m´ınimo valor entre la proporci´on de “tiempo” en que se encuentran
en el hipografo y epigrafo de otras funciones. As´ı, podemos
detectar ciertos outliers y marcar las observaciones centrales:
0 50 100 150 200 250
0
1
2
3
4
5
6
7
8
9
10
x 10
5
Tiempo desde el comienzo [Ventanas de 300 s]
Throughput[Bps]
Media
Curva Max. Prof. (original)
Curva Max. Prof. (est.)
Curva Min. Prof. (hipografo)
Curva Min. Prof. (epigrafo)
Curva Est. Min. Prof. (hipografo)
Curva Est. Min. Prof. (epigrafo)
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 14
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
Homogeneidad, clustering y clasificaci´on funcional (I)
Homogeneidad
Cuando se tienen dos o m´as muestras, una cuesti´on que se
plantea de forma natural es si ambas proceden de trayectorias
del mismo proceso estoc´astico. En el caso de las estad´ısticas
cl´asicas, existen distintos m´etodos que pueden ser usados para
evaluar la homogeneidad de dos muestras (e.g. el test χ2).
En el ´area de FDA, existen algunas propuestas recientes con
resultados prometedores para dar respuesta a esta pregunta.
El uso de la homogeneidad funcional en el ´area de la gesti´on
de red proporciona un nuevo enfoque de la evaluaci´on de la
representatividad de un cierto conjunto de par´ametros de red.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 15
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Preprocesado de datos de red
An´alisis de datos de red
Homogeneidad, clustering y clasificaci´on funcional (II)
Clustering, clasificaci´on y predicci´on
FDA ofrece un ecosistema completo de t´ecnicas, que permiten
realizar clustering, clasificaci´on y predicci´on de funciones.
El estudio de variables aleatorias funcionales abre un nuevo
campo para la clasificaci´on de tr´afico cifrado, utilizando una
aproximaci´on basada en la determinaci´on de los perfiles
temporales de distintas clases de tr´afico.
Las t´ecnicas de predicci´on con respuesta funcional permiten
obtener curvas o superficies completas que modelan el
comportamiento del sistema durante un per´ıodo completo –
e.g. un d´ıa.
Estas aproximaciones podr´ıan tener grandes ventajas en el
´ambito de la planificaci´on din´amica (e.g. SDNs) y otros
entornos flexibles tales como las infraestructuras tipo Cloud.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 16
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
Conclusiones
Las t´ecnicas de FDA tienen aplicaci´on en el ´ambito del
an´alisis y gesti´on de redes.
Preprocesado de datos de monitorizaci´on: Representaci´on
funcional y PCA funcional.
An´alisis de datos de monitorizaci´on: Profundidad funcional,
homogeneidad, clustering, clasificaci´on y predicci´on.
FDA facilita la realizaci´on de tareas relativas a la gesti´on de la
seguridad y prestaciones de servicios de red.
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 17
Introducci´on
Antecedentes
T´ecnicas funcionales exploradas y resultados experimentales
Conclusiones
¡Gracias por su atenci´on!
¿Preguntas?
D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 18

Más contenido relacionado

Similar a Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportunidades

Sistema De Informacion Gerencial
Sistema De Informacion GerencialSistema De Informacion Gerencial
Sistema De Informacion GerencialAndrescriba
 
Sistema De Informacion Gerencial
Sistema De Informacion GerencialSistema De Informacion Gerencial
Sistema De Informacion Gerencialmayracume
 
Sistema De Información Gerencial
Sistema De Información GerencialSistema De Información Gerencial
Sistema De Información Gerencialricardolch21
 
Sistema de informacion gerencial
Sistema de informacion gerencialSistema de informacion gerencial
Sistema de informacion gerencialsanmarquino
 
Sistema de informacion gerencial
Sistema de informacion gerencialSistema de informacion gerencial
Sistema de informacion gerencialsanmarquino
 
Aula virtual de base de datos
Aula virtual de base de datosAula virtual de base de datos
Aula virtual de base de datosPatty Gavilanes
 
Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...
Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...
Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...Jesus Caceres Tello
 
k vector search technique (spanish)
k vector search technique (spanish)k vector search technique (spanish)
k vector search technique (spanish)El Suizo
 
Analisis comparativo de mysql vs oracle
Analisis comparativo de mysql vs oracleAnalisis comparativo de mysql vs oracle
Analisis comparativo de mysql vs oraclesergio
 
Por qué hacemos persistencia de datos
Por qué hacemos persistencia de datosPor qué hacemos persistencia de datos
Por qué hacemos persistencia de datosCarlos Gustavo Ruiz
 
Publicación de datos y métodos científicos en investigación
Publicación de datos y métodos científicos en investigaciónPublicación de datos y métodos científicos en investigación
Publicación de datos y métodos científicos en investigacióndgarijo
 
Diseño experimental
Diseño experimentalDiseño experimental
Diseño experimentaljtjcinvestav
 
Microsoft PowerPoint - Semana_05.pdf
Microsoft PowerPoint - Semana_05.pdfMicrosoft PowerPoint - Semana_05.pdf
Microsoft PowerPoint - Semana_05.pdfGabrielDelgado780554
 

Similar a Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportunidades (20)

Sistema De Informacion Gerencial
Sistema De Informacion GerencialSistema De Informacion Gerencial
Sistema De Informacion Gerencial
 
Sistema De Informacion Gerencial
Sistema De Informacion GerencialSistema De Informacion Gerencial
Sistema De Informacion Gerencial
 
Sistema De Información Gerencial
Sistema De Información GerencialSistema De Información Gerencial
Sistema De Información Gerencial
 
Sistema de informacion gerencial
Sistema de informacion gerencialSistema de informacion gerencial
Sistema de informacion gerencial
 
Sistema de informacion gerencial
Sistema de informacion gerencialSistema de informacion gerencial
Sistema de informacion gerencial
 
Para el producto final de curso
Para el producto final de cursoPara el producto final de curso
Para el producto final de curso
 
Michelle heredia 27145140
Michelle heredia 27145140Michelle heredia 27145140
Michelle heredia 27145140
 
Aula virtual de base de datos
Aula virtual de base de datosAula virtual de base de datos
Aula virtual de base de datos
 
Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...
Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...
Procesos de normalización y optimización de modelos de datos: ISO21090 y EN13...
 
electiva i-tray-ii
 electiva i-tray-ii electiva i-tray-ii
electiva i-tray-ii
 
Malla pnfi-tray-ii
Malla pnfi-tray-iiMalla pnfi-tray-ii
Malla pnfi-tray-ii
 
k vector search technique (spanish)
k vector search technique (spanish)k vector search technique (spanish)
k vector search technique (spanish)
 
02000 metodo validacion
02000 metodo validacion02000 metodo validacion
02000 metodo validacion
 
Analisis comparativo de mysql vs oracle
Analisis comparativo de mysql vs oracleAnalisis comparativo de mysql vs oracle
Analisis comparativo de mysql vs oracle
 
Diseño de una base de datos I.docx
Diseño de una base de datos I.docxDiseño de una base de datos I.docx
Diseño de una base de datos I.docx
 
Por qué hacemos persistencia de datos
Por qué hacemos persistencia de datosPor qué hacemos persistencia de datos
Por qué hacemos persistencia de datos
 
Semana 1 - Informàtica
Semana 1 - InformàticaSemana 1 - Informàtica
Semana 1 - Informàtica
 
Publicación de datos y métodos científicos en investigación
Publicación de datos y métodos científicos en investigaciónPublicación de datos y métodos científicos en investigación
Publicación de datos y métodos científicos en investigación
 
Diseño experimental
Diseño experimentalDiseño experimental
Diseño experimental
 
Microsoft PowerPoint - Semana_05.pdf
Microsoft PowerPoint - Semana_05.pdfMicrosoft PowerPoint - Semana_05.pdf
Microsoft PowerPoint - Semana_05.pdf
 

Más de Jorge E. López de Vergara Méndez

On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...Jorge E. López de Vergara Méndez
 
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Jorge E. López de Vergara Méndez
 
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Jorge E. López de Vergara Méndez
 
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOPMONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOPJorge E. López de Vergara Méndez
 
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Jorge E. López de Vergara Méndez
 
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateEvaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateJorge E. López de Vergara Méndez
 
Integración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redIntegración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redJorge E. López de Vergara Méndez
 

Más de Jorge E. López de Vergara Méndez (9)

On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...
 
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
 
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
 
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOPMONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP
 
Merging heterogeneous network measurement data
Merging heterogeneous network measurement dataMerging heterogeneous network measurement data
Merging heterogeneous network measurement data
 
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
 
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateEvaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
 
Defining ontologies for IP traffic measurements at MOI ISG
Defining ontologies for IP traffic measurements at MOI ISGDefining ontologies for IP traffic measurements at MOI ISG
Defining ontologies for IP traffic measurements at MOI ISG
 
Integración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redIntegración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de red
 

Último

PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdfAnaBelindaArmellonHi
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffJefersonBazalloCarri1
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 

Último (20)

PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffff
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 

Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportunidades

  • 1. An´alisis de Datos Funcionales para Gesti´on de Red T´ecnicas, Retos y Oportunidades David Muelas, Jorge E. L´opez de Vergara, Jos´e R. Berrendero, Javier Aracil {dav.muelas, jorge.lopez vergara, joser.berrendero, javier.aracil}@uam.es Universidad Aut´onoma de Madrid JITEL 2015 – Octubre de 2015
  • 2. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Contenidos 1 Introducci´on Motivaci´on ¿Qu´e proponemos? 2 Antecedentes Principios Emplazamiento de nuestro trabajo 3 T´ecnicas funcionales exploradas y resultados experimentales Preprocesado de datos de red An´alisis de datos de red 4 Conclusiones D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 2
  • 3. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Motivaci´on ¿Qu´e proponemos? Contexto Las infraestructuras de red est´an inmersas en un continuo cambio: Redes Definidas por Software – Software Defined Networking (SDN) Infraestructuras Multitenant / Cloud Redes virtualizadas . . . y tambi´en estamos viviendo la transformaci´on de los procesos de an´alisis de datos: Era del Big Data: aumento del volumen de datos y de la capacidad de c´omputo Flujos de datos y procesos orientados a extraer conocimiento de datos en crudo . . . D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 3
  • 4. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Motivaci´on ¿Qu´e proponemos? Una ventana de oportunidad Explotar nuevas estrategias, recursos de computaci´on y sinergias entre distintos campos de la ciencia y la tecnolog´ıa puede ayudar a mejorar las acciones de gesti´on. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 4
  • 5. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Motivaci´on ¿Qu´e proponemos? Nuestra propuesta Aprovechar los avances en el An´alisis de Datos Funcionales (Functional Data Analysis, FDA), para estudiar y explotar diversos datos procedentes de medidas de red. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 5
  • 6. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Motivaci´on ¿Qu´e proponemos? Nuestras aportaciones Proporcionamos una revisi´on de los antecedentes que motivan nuestra propuesta. Revisamos distintas t´ecnicas de FDA, con el fin de ofrecer un cat´alogo de t´ecnicas para investigadores y profesionales del ´area de Ingenier´ıa Telem´atica. Evaluamos las ganancias que se pueden obtener en la gesti´on de red mediante la aplicaci´on de FDA. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 6
  • 7. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Principios Emplazamiento de nuestro trabajo Direcciones en la gesti´on de red FDA permite extender y explotar muchos de los principios que presentan las ´ultimas herramientas y soluciones de monitorizaci´on y an´alisis de redes: Flexibilidad y adaptabilidad: sistemas modulares, m´etodos que se ajusten a las caracter´ısticas concretas de cada entorno. Conocimiento y datos: extracci´on de conocimiento a partir de datos y medidas. Explotaci´on de la capacidad de c´omputo disponible: estudios complejos, sin miedo a la alta dimensionalidad. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 7
  • 8. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Principios Emplazamiento de nuestro trabajo Integraci´on en el estado de la t´ecnica Despliegue e implementaci´on: implementaciones libres de FDA en R o MATLAB, posible incluir estas t´ecnicas en sistemas como Scap, Blockmon, M3Omon,. . . Antecedentes en la literatura: eigenflows, para estudio de anomal´ıas y caracterizaci´on del comportamiento de la red; an´alisis multi-resoluci´on,. . . Mayor riqueza en los modelos de red: FDA permite incrementar la dimensionalidad de los modelos de red, proporcionando mayor riqueza que an´alisis multivariantes, y relajando algunas hip´otesis de las t´ecnicas cl´asicas. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 8
  • 9. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red Representaci´on funcional: formulaci´on anal´ıtica Base funcional: {Bk(t)}t∈T,k∈Z Proyecciones: {βk}k∈Z Observaciones: {Xt} = j∈Z βj Bj (t), t ∈ T Representaci´on truncada: {Xt} = [ j∈J βj Bj (t)] + (J, {Bj }), t ∈ T D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 9
  • 10. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red PCA funcional (I) Permite seleccionar una base funcional para representar de forma ´optima el conjunto de observaciones considerado. 0 50 100 150 200 250 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 Tiempo desde el comienzo [Ventanas de 300 s] Figura: Comportamiento de las 30 primeras componentes principales D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 10
  • 11. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red PCA funcional (II) El estudio de los coeficientes de las observaciones con respecto a esta base permite detectar clusters y clasificar curvas: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 −4 −2 0 2 4 6 8 10 12 x 10 6 Componente principal correspondiente Densidaddecoeficientes Cluster 2 Cluster 1 Figura: Densidad de los coeficientes por componente principal D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 11
  • 12. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red PCA funcional (III) Este preprocesado se puede utilizar como mecanismo de compresi´on: 0 50 100 150 200 250 0 2 4 6 8 10 x 10 5 Tiempo desde el comienzo [Ventanas de 300 s] Throughput[Bps] 0 50 100 150 200 250 0 2 4 6 8 10 x 10 5 Figura: Comparativa entre las observaciones originales (superior) y las series reconstruidas (inferior) tras el preprocesado de los datos. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 12
  • 13. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red Profundidad funcional (I) No existe una noci´on ´unica de profundidad, sino que se trata de un concepto que se define en base a ciertas propiedades de centralidad de las observaciones. En nuestro caso, vamos a seguir la definici´on dada por la expresi´on MSn,H(x) = m´ın{SLn(x), ILn(x)} donde SLn(x) = 1 nλ(I) n i=1 λ{t ∈ T : x(t) ≤ xi (t)} ILn(x) = 1 nλ(I) n i=1 λ{t ∈ T : x(t) ≥ xi (t)} siendo λ la medida de Lebesgue. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 13
  • 14. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red Profundidad funcional (II) Con esta definici´on, estamos ordenando las observaciones usando el m´ınimo valor entre la proporci´on de “tiempo” en que se encuentran en el hipografo y epigrafo de otras funciones. As´ı, podemos detectar ciertos outliers y marcar las observaciones centrales: 0 50 100 150 200 250 0 1 2 3 4 5 6 7 8 9 10 x 10 5 Tiempo desde el comienzo [Ventanas de 300 s] Throughput[Bps] Media Curva Max. Prof. (original) Curva Max. Prof. (est.) Curva Min. Prof. (hipografo) Curva Min. Prof. (epigrafo) Curva Est. Min. Prof. (hipografo) Curva Est. Min. Prof. (epigrafo) D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 14
  • 15. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red Homogeneidad, clustering y clasificaci´on funcional (I) Homogeneidad Cuando se tienen dos o m´as muestras, una cuesti´on que se plantea de forma natural es si ambas proceden de trayectorias del mismo proceso estoc´astico. En el caso de las estad´ısticas cl´asicas, existen distintos m´etodos que pueden ser usados para evaluar la homogeneidad de dos muestras (e.g. el test χ2). En el ´area de FDA, existen algunas propuestas recientes con resultados prometedores para dar respuesta a esta pregunta. El uso de la homogeneidad funcional en el ´area de la gesti´on de red proporciona un nuevo enfoque de la evaluaci´on de la representatividad de un cierto conjunto de par´ametros de red. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 15
  • 16. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Preprocesado de datos de red An´alisis de datos de red Homogeneidad, clustering y clasificaci´on funcional (II) Clustering, clasificaci´on y predicci´on FDA ofrece un ecosistema completo de t´ecnicas, que permiten realizar clustering, clasificaci´on y predicci´on de funciones. El estudio de variables aleatorias funcionales abre un nuevo campo para la clasificaci´on de tr´afico cifrado, utilizando una aproximaci´on basada en la determinaci´on de los perfiles temporales de distintas clases de tr´afico. Las t´ecnicas de predicci´on con respuesta funcional permiten obtener curvas o superficies completas que modelan el comportamiento del sistema durante un per´ıodo completo – e.g. un d´ıa. Estas aproximaciones podr´ıan tener grandes ventajas en el ´ambito de la planificaci´on din´amica (e.g. SDNs) y otros entornos flexibles tales como las infraestructuras tipo Cloud. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 16
  • 17. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones Conclusiones Las t´ecnicas de FDA tienen aplicaci´on en el ´ambito del an´alisis y gesti´on de redes. Preprocesado de datos de monitorizaci´on: Representaci´on funcional y PCA funcional. An´alisis de datos de monitorizaci´on: Profundidad funcional, homogeneidad, clustering, clasificaci´on y predicci´on. FDA facilita la realizaci´on de tareas relativas a la gesti´on de la seguridad y prestaciones de servicios de red. D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 17
  • 18. Introducci´on Antecedentes T´ecnicas funcionales exploradas y resultados experimentales Conclusiones ¡Gracias por su atenci´on! ¿Preguntas? D. Muelas, J. E. L´opez de Vergara, J. R. Berrendero, J. Aracil An´alisis de Datos Funcionales para Gesti´on de Red 18