SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO
DE RED CON APACHE HADOOP
Rubén García-Valcárcel, Rafael Leira, Iván González,
Jorge E. López de Vergara
ruben4593@gmail.com, {rafael.leira, ivan.gonzalez,
jorge.lopez_vergara}@uam.es
JITEL 2015 – 15 de Octubre de 2015
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Tabla de contenidos
1 Introducción
2 Estado del arte
3 Sistema propuesto
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
4 Experimentos
Análisis mediante Hive
Rendimiento
Sistemas utilizados
Comparativa global
5 Conclusiones
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 2
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Introducción
Objetivo: Monitorización pasiva y Análisis de redes de
comunicaciones.
Necesidad de un sistema escalable y fiable frente al crecimiento
exponencial de las redes
Diseño de un sistema para la captura, el almacenamiento, el
procesamiento y el análisis de tráfico de red basado en Hadoop
Evaluación del sistema mediante la monitorización de la red de los
laboratorios docentes de la Escuela Politécnica Superior (en la
UAM).
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 3
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Estado del arte
Herramientas habituales para la captura y procesamiento de tráfico
Bajas tasas de red (tcpdump, wireshark...)
Altas tasas de red
APIs de alta velocidad (Intel DPDK...)
Hardware dedicado (GPUs, FPGAs...)
Computación distribuida
Google: GFS y MapReduce
Apache: HDFS y YARN
Procesamiento de tráfico mediante Hadoop
[RIPE]: Pesada, lenta y limitada. Librerías de terceros
[Yeonhee Lee]: Heurística de fragmentado PCAP. Código liberado
incompleto
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 4
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Sistema propuesto
Arquitectura de la red de prueba
Red interna
Internet
Sonda de
captura
Firewall
Hadoop
TAP
Servidor DNS
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 5
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Sistema de captura
FlowProcess
La sonda de captura:
Almacena los paquetes:
En formato PCAP
Truncados a 300 bytes (por motivos de privacidad, también reduce el
espacio consumido)
Crea archivos de aproxidamente 1 GB
La sonda descarta los paquetes que contengan la dirección IP de la
propia sonda.
Genera archivos en texto plano con información relativa a los flujos
(Netflow extendido)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 6
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Sistema propuesto
Arquitectura del sistema
Hadoop
AnálisisPreprocesamientoCaptura
PCAPs
Flujos
DNS
HTTP
HTTPS
Tareas
MapReduce
Hive
PCAPs
Tablas
Gráficas
Deseria-
lizador
PrediccionesWeka
Admin
Sonda de
captura
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 7
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Procesamiento
Se parte del trabajo de [RIPE], pero:
Se han reimplementado de los disectores de HTTP y DNS
Implementación de un nuevo disector de HTTPS
Mejora de rendimiento
Eliminación del reensamblado TCP
Guardado de los campos en estructuras fijas en lugar de una tabla
hash.
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 8
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 9
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Series temporales del consumo de la red por días (periodo 20/02/15 − 01/05/15)
Series temporales del consumo de la red por horas (periodo 16/03/15 − 20/03/15)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 10
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Bytes (exterior) y flujos (interior) usados por cada protocolo y puerto
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 11
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Las 16 asignaturas que más han consumido (periodo 02/02/15 − 01/05/15)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 12
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Ordenadores encendidos cada noche (periodo 02/02/15 − 01/05/15)
Ordenadores inactivos cada semana (periodo 02/02/15 − 01/05/15)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 13
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Páginas web más solicitadas vía HTTP (izquierda) y HTTPS (derecha)
agrupadas por dominio de segundo nivel
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 14
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Pruebas de rendimiento
Sistemas utilizados
Características de los sistemas de pruebas
Sistema
RAM
Discos CPU
Total Red
(GB) cores (Gbps)
Hadoop
Esclavo 1 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1
Esclavo 2 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1
Esclavo 3 256 4x 3 TB 4x Xeon E7-4830 @ 2,13 GHz 32 1
Esclavo 4 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1
Esclavo 5 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1
Servidor Alto Rendimiento 32 RAID 0: 9x 3 TB 2x Xeon E5-2630 @ 2,6 GHz 12 -
[Y. Lee] (30 nodos) 30x 19 30x 4 TB 30x 8 cores @ 2,93 GHz 240 1
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 15
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Pruebas de rendimiento
Comparativa global
Rendimiento de cada sistema al procesar 1 TB
Programa Gbps Gbps/core
Hadoop
Disector HTTP 7,13 0,11
Disector HTTPS 7,41 0,12
Disector DNS 7,72 0,12
Test de lectura 4,98 0,08
Disector HTTP serie (en c) en S.A.R. 4,21 4,21 (1 core)
Versión de [Y. Lee]
5 nodos 1,9 0,05
30 nodos 14,0 0,06
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 16
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Conclusiones
Se ha creado una batería de consultas en Hive, y un medio para
crear nuevos análisis de la red.
El proyecto Apache Hadoop permite escalar horizontalmente con
facilidad.
Con un bajo coste de desarrollo se han alcanzado 7 Gbps.
Se pretende integrar el sistema con otros de Big Data como Apache
Mahout, extendiendo así sus capacidades.
No obstante Hadoop tiene limitaciones: Java,
homogeneidad/heterogeneidad del clúster, etc.
Dichas limitaciones se pretenden superar investigando en el campo
del almacenamiento (HDFS), así como en las posibles uniones de
Hadoop con hardware específico (GPUs, FPGAs...) con el objetivo
de crear un sistema más económico y estable.
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 17
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Gracias por su atención
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 18

Más contenido relacionado

Destacado

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementaciónDiego Krauthamer
 
nerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopnerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopRestorando
 
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopHerramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopDavid Albela Pérez
 
Polybase
PolybasePolybase
PolybaseSolidQ
 
Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datosAntonio Rodriguez
 
¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?Socialmetrix
 
Monta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu EmpresaMonta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu EmpresaUrko Zurutuza
 
Creación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con ClouderaCreación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con ClouderaDavid Albela Pérez
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Stratebi
 
Administración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de ClouderaAdministración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de ClouderaDavid Albela Pérez
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IUrko Zurutuza
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Ángel Rayo
 
Creando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWSCreando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWSAmazon Web Services LATAM
 

Destacado (18)

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementación
 
Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1
 
Hadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadasHadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadas
 
nerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopnerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshop
 
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopHerramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
 
Polybase
PolybasePolybase
Polybase
 
Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datos
 
¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?
 
Monta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu EmpresaMonta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu Empresa
 
Introducción a Docker
Introducción a DockerIntroducción a Docker
Introducción a Docker
 
Creación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con ClouderaCreación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con Cloudera
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
 
Administración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de ClouderaAdministración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de Cloudera
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 
Oracle SOA Suite
Oracle SOA SuiteOracle SOA Suite
Oracle SOA Suite
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016
 
Creando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWSCreando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWS
 

Similar a MONITORIZACIÓN Y ANÁLISIS DE RED CON HADOOP

Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Miguel Pastor
 
Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana
 Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana
Log -Analytics con Apache-Flume Elasticsearch HDFS KibanaFelix Rodriguez
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics Spain
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataSpanishPASSVC
 
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!Paradigma Digital
 
Pablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataPablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataSmash Tech
 
SolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ
 
Codemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache FlinkCodemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache FlinkLuis Roldán
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) Luis Fernando Aguas Bucheli
 
An evening with... Apache hadoop Meetup
An evening with...  Apache hadoop MeetupAn evening with...  Apache hadoop Meetup
An evening with... Apache hadoop MeetupArkhotech
 
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web ServicesLuis Fernando Aguas Bucheli
 

Similar a MONITORIZACIÓN Y ANÁLISIS DE RED CON HADOOP (20)

Introducción a Hadoop
Introducción a HadoopIntroducción a Hadoop
Introducción a Hadoop
 
3. Hadoop
3.  Hadoop3.  Hadoop
3. Hadoop
 
Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring
 
Presentacion
PresentacionPresentacion
Presentacion
 
Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana
 Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana
Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana
 
Open analytics. data analytics con hadoop
Open analytics. data analytics con hadoopOpen analytics. data analytics con hadoop
Open analytics. data analytics con hadoop
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con Hadoop
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big data
 
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
 
Pablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataPablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open Data
 
SolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datos
 
Codemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache FlinkCodemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache Flink
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
 
SMBD 2011
SMBD 2011SMBD 2011
SMBD 2011
 
SMBD 2011
SMBD 2011SMBD 2011
SMBD 2011
 
Best hadoop bigdata architecture resume
Best hadoop bigdata architecture resume Best hadoop bigdata architecture resume
Best hadoop bigdata architecture resume
 
An evening with... Apache hadoop Meetup
An evening with...  Apache hadoop MeetupAn evening with...  Apache hadoop Meetup
An evening with... Apache hadoop Meetup
 
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
 
Hadoop en accion
Hadoop en accionHadoop en accion
Hadoop en accion
 

Más de Jorge E. López de Vergara Méndez

On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...Jorge E. López de Vergara Méndez
 
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Jorge E. López de Vergara Méndez
 
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Jorge E. López de Vergara Méndez
 
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...Jorge E. López de Vergara Méndez
 
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Jorge E. López de Vergara Méndez
 
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateEvaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateJorge E. López de Vergara Méndez
 
Integración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redIntegración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redJorge E. López de Vergara Méndez
 

Más de Jorge E. López de Vergara Méndez (9)

On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...
 
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
 
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
 
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
 
Merging heterogeneous network measurement data
Merging heterogeneous network measurement dataMerging heterogeneous network measurement data
Merging heterogeneous network measurement data
 
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
 
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateEvaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
 
Defining ontologies for IP traffic measurements at MOI ISG
Defining ontologies for IP traffic measurements at MOI ISGDefining ontologies for IP traffic measurements at MOI ISG
Defining ontologies for IP traffic measurements at MOI ISG
 
Integración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redIntegración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de red
 

Último

2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptxccordovato
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxYoladsCabarcasTous
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotessald071205mmcnrna9
 
Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiatongailustraconcienc
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptxKatherineFabianLoza1
 
DIPLOMA DE CERTIFICADO EQQW_removed.pptx
DIPLOMA DE CERTIFICADO EQQW_removed.pptxDIPLOMA DE CERTIFICADO EQQW_removed.pptx
DIPLOMA DE CERTIFICADO EQQW_removed.pptxKaterin yanac tello
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405rodrimarxim
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfhernestosoto82
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería yocelynsanchezerasmo
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfEDUARDO MAMANI MAMANI
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docxmarthaarroyo16
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILeluniversocom
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Ivie
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 

Último (20)

2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptx
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotes
 
Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologia
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
 
DIPLOMA DE CERTIFICADO EQQW_removed.pptx
DIPLOMA DE CERTIFICADO EQQW_removed.pptxDIPLOMA DE CERTIFICADO EQQW_removed.pptx
DIPLOMA DE CERTIFICADO EQQW_removed.pptx
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdf
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 

MONITORIZACIÓN Y ANÁLISIS DE RED CON HADOOP

  • 1. MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP Rubén García-Valcárcel, Rafael Leira, Iván González, Jorge E. López de Vergara ruben4593@gmail.com, {rafael.leira, ivan.gonzalez, jorge.lopez_vergara}@uam.es JITEL 2015 – 15 de Octubre de 2015
  • 2. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Tabla de contenidos 1 Introducción 2 Estado del arte 3 Sistema propuesto Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop 4 Experimentos Análisis mediante Hive Rendimiento Sistemas utilizados Comparativa global 5 Conclusiones R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 2
  • 3. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Introducción Objetivo: Monitorización pasiva y Análisis de redes de comunicaciones. Necesidad de un sistema escalable y fiable frente al crecimiento exponencial de las redes Diseño de un sistema para la captura, el almacenamiento, el procesamiento y el análisis de tráfico de red basado en Hadoop Evaluación del sistema mediante la monitorización de la red de los laboratorios docentes de la Escuela Politécnica Superior (en la UAM). R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 3
  • 4. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Estado del arte Herramientas habituales para la captura y procesamiento de tráfico Bajas tasas de red (tcpdump, wireshark...) Altas tasas de red APIs de alta velocidad (Intel DPDK...) Hardware dedicado (GPUs, FPGAs...) Computación distribuida Google: GFS y MapReduce Apache: HDFS y YARN Procesamiento de tráfico mediante Hadoop [RIPE]: Pesada, lenta y limitada. Librerías de terceros [Yeonhee Lee]: Heurística de fragmentado PCAP. Código liberado incompleto R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 4
  • 5. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Sistema propuesto Arquitectura de la red de prueba Red interna Internet Sonda de captura Firewall Hadoop TAP Servidor DNS R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 5
  • 6. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Sistema de captura FlowProcess La sonda de captura: Almacena los paquetes: En formato PCAP Truncados a 300 bytes (por motivos de privacidad, también reduce el espacio consumido) Crea archivos de aproxidamente 1 GB La sonda descarta los paquetes que contengan la dirección IP de la propia sonda. Genera archivos en texto plano con información relativa a los flujos (Netflow extendido) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 6
  • 7. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Sistema propuesto Arquitectura del sistema Hadoop AnálisisPreprocesamientoCaptura PCAPs Flujos DNS HTTP HTTPS Tareas MapReduce Hive PCAPs Tablas Gráficas Deseria- lizador PrediccionesWeka Admin Sonda de captura R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 7
  • 8. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Procesamiento Se parte del trabajo de [RIPE], pero: Se han reimplementado de los disectores de HTTP y DNS Implementación de un nuevo disector de HTTPS Mejora de rendimiento Eliminación del reensamblado TCP Guardado de los campos en estructuras fijas en lugar de una tabla hash. R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 8
  • 9. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 9
  • 10. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Series temporales del consumo de la red por días (periodo 20/02/15 − 01/05/15) Series temporales del consumo de la red por horas (periodo 16/03/15 − 20/03/15) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 10
  • 11. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Bytes (exterior) y flujos (interior) usados por cada protocolo y puerto R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 11
  • 12. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Las 16 asignaturas que más han consumido (periodo 02/02/15 − 01/05/15) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 12
  • 13. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Ordenadores encendidos cada noche (periodo 02/02/15 − 01/05/15) Ordenadores inactivos cada semana (periodo 02/02/15 − 01/05/15) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 13
  • 14. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Páginas web más solicitadas vía HTTP (izquierda) y HTTPS (derecha) agrupadas por dominio de segundo nivel R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 14
  • 15. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Pruebas de rendimiento Sistemas utilizados Características de los sistemas de pruebas Sistema RAM Discos CPU Total Red (GB) cores (Gbps) Hadoop Esclavo 1 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1 Esclavo 2 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1 Esclavo 3 256 4x 3 TB 4x Xeon E7-4830 @ 2,13 GHz 32 1 Esclavo 4 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1 Esclavo 5 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1 Servidor Alto Rendimiento 32 RAID 0: 9x 3 TB 2x Xeon E5-2630 @ 2,6 GHz 12 - [Y. Lee] (30 nodos) 30x 19 30x 4 TB 30x 8 cores @ 2,93 GHz 240 1 R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 15
  • 16. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Pruebas de rendimiento Comparativa global Rendimiento de cada sistema al procesar 1 TB Programa Gbps Gbps/core Hadoop Disector HTTP 7,13 0,11 Disector HTTPS 7,41 0,12 Disector DNS 7,72 0,12 Test de lectura 4,98 0,08 Disector HTTP serie (en c) en S.A.R. 4,21 4,21 (1 core) Versión de [Y. Lee] 5 nodos 1,9 0,05 30 nodos 14,0 0,06 R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 16
  • 17. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Conclusiones Se ha creado una batería de consultas en Hive, y un medio para crear nuevos análisis de la red. El proyecto Apache Hadoop permite escalar horizontalmente con facilidad. Con un bajo coste de desarrollo se han alcanzado 7 Gbps. Se pretende integrar el sistema con otros de Big Data como Apache Mahout, extendiendo así sus capacidades. No obstante Hadoop tiene limitaciones: Java, homogeneidad/heterogeneidad del clúster, etc. Dichas limitaciones se pretenden superar investigando en el campo del almacenamiento (HDFS), así como en las posibles uniones de Hadoop con hardware específico (GPUs, FPGAs...) con el objetivo de crear un sistema más económico y estable. R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 17
  • 18. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Gracias por su atención R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 18