SlideShare una empresa de Scribd logo
1 de 21
BIG DATA & SEGURIDAD
UN MATRIMONIO DE FUTURO
PRESENTACIÓN
ANTONIO GONZÁLEZ CASTRO
IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES
antoniogonzalezcastro.esagcastro@pragsis.com
linkedin.com/in/agonzaca@agonzaca
CONTENIDO
¿Qué es esto del Big Data?
¿Son realmente seguras las plataformas Big Data?
¿Podemos aprovechar esta tecnología en las áreas de seguridad?
¿QUÉ ES ESTO DEL BIG DATA?
NO ES SOLO TECNOLOGÍA…
Conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en
capturar el valor que los propios datos encierran.
¿Qué lo hace diferente e innovador?
VOLUMEN VARIEDAD VELOCIDAD
CRECIMIENTO DE LOS DATOS EN EL MUNDO REAL
A DÍA DE HOY
El número de dispositivos en red,
equivale a la población mundial.
EN EL AÑO 2016
x2
Fuente: Intel: What Happens in an Internet Minute?
1m
TIPOS DE DATOS
SMART DATA
Datos referentes al negocio (online/offline). En este grupo podemos encontrar cifras de ventas,
estrategia de negocio, datos sobre los clientes, etc. Todo aquello que este relacionado con los
objetivos de la empresa.
INDENTITY DATA
Datos referentes que nos permiten identificar a nuestros clientes actuales, así como datos de sus
gustos, historial de compras, interacciones con nuestros contenidos, etc.
OPEN DATA
Agrupa al resto de datos externos a la empresa y que son accesibles por todo el mundo.
¿UNA MODA?
BIG DATA YA ES UNA REALIDAD
Las empresas ya están empezando a analizar lo que realmente les interesa: SUS CLIENTES.
Empresas como Facebook, Google y Amazon han llegado al éxito
gracias a esta tecnología.
Ya se esta poniendo un gran foco en desarrollar aquellos productos que el mercado demanda.
ALGUNAS EMPRESAS QUE UTILIZAN BIG DATA
CAPAS FUNCIONALES DE INTEGRACIÓN
TIEMPO REAL
REPOSITORIO BIG DATA
ANALÍTICA
ETL
ALMACENAMIENTO
PROCESAMIENTO BATCH
 Datos estructurados.
 Datos no estructurados.
 Motor de reglas.
 Datos en brutos.
 Datos transformados.
 Modelos analíticos.
 Motor de reglas.
TECNOLOGÍA BIG DATA, HADOOP
OPEN SOURCE (PROYECTO APACHE)
 Almacenar y procesar gran cantidad de datos.
 Implementado en JAVA.
 Posibilidad de desarrollar en otros lenguajes.
 Económico, rápido y eficiente.
HDFS
 Sistema de archivos distribuido.
 Los datos se replican en varias máquinas.
MapReduce
 Procesamiento por lotes.
 Consulta de datos sobre HDFS.
 MapReduce + HDFS = Localidad.
USUARIO
MAPREDUCE HDFS
Job Tracker Name Node
Data Node &
Task Tracker
Data Node &
Task Tracker
Data Node &
Task Tracker
Data Node &
Task Tracker
…
…
¿POR QUÉ HADOOP FUNCIONA?
ESCENARIO TRADICIONAL ESCENARIO HADOOP
DATOS DATOS
COMPONENTES DE HADOOP
ECOSISTEMA
HADOOP
CORE
HADOOP
HBase Flume Sqoop Mahout
Hive Pig Impala …
EL HARDWARE Y EL CÁLCULO DE CAPACIDADES
NODOS ESCLAVOS
 Procesadores: 2x6 core 2.9 GHz.
 Memoria RAM: 48-96 GB.
 Red: 10 GB.
 Disco Duro: 12x3 TB (NO-RAID)
NODOS MAESTROS
 Carrier-class.
 Dos tarjetas de red.
 Disco Duro en RAID.
 Dos fuentes de alimentación.
POR NODO = ESPACIO EN DISCO / 4
SI MUY BIEN, ¿PERO ESTOS DATOS ESTAN SEGUROS?
NO!Actualmente existen varios problemas de seguridad
AUTENTICACIÓN AUTORIZACIÓN
CIFRADO EJECUCIÓN DE CÓDIGO
TODO TIENE SOLUCIÓN, ARQUITECTURA SEGURA
CONTROL DE ACCESOS
CIFRADO DEL TÁFICO DE RED
ENMASCARADO DE INFORMACIÓN
ARQUITECTURA RED AISLADA
SEGURIDAD SOBRE HADOOP AL DETALLE
 Kerberos RPC (SASL / GSSAPI) autenticar a los usuarios.
 Consolas web HTTP (HTTP SPNEGO) conexiones HTTP.
 Tokens de delegación después de la autenticación para evitar carga.
AUTENTICACIÓN
AUTORIZACIÓN
CIFRADO
EJECUCIÓN CÓDIGO
 Autorización a datos en HDFS a través del NameNode basado en el
control de acceso (ACL) de los usuarios y grupos.
 Bloque de Tokens (HMAC-SHA1) control de acceso a los bloques de datos.
 Conexiones SASL (Kerberos y Autenticación RPC).
 Consolas Web y Operaciones MapReduce (SSL).
 HDFS Soluciones comerciales.
 Se soluciona con los pasos indicados en autorización (Tokens).
MENSAJE PARA LOS SECURITY RESEARCHER
security@hadoop.apache.org
MMM! ¿SI LO UTILIZAMOS PARA SEGURIDAD?
CENTRALIZACIÓN DE EVENTOS
DETECCIÓN DEL FRAUDE
ANÁLISIS FORENSE
CIBERVIGILANCIA
DETECCIÓN DE AMENAZAS Y ATAQUES
CASO DE USO, DETECCIÓN DE FRAUDE
DATOS
TRANSACIONES
PERFIL DE CLIENTE
CIBERVIGILANCIA
ID CLIENTE / IP ORIGEN / FECHA / TARJETA / CANTIDAD
ID CLIENTE / MEDIA CONSUMO / POSICION HABITUAL
USUARIOS / TARJETAS
ESCENARIO
[13/06/2014 10:13:52] [5598CM23 1234567890123457] [80.26.83.175] [150]
[13/06/2014 10:43:12] [5598CM23 1234567890123457] [148.245.38.39] [45]
[12/06/2014 09:20:35] [5598CM23 1234567890123457] [195.60.81.64] [4900]
CUANDO QUIEN DONDE
EL QUE
¿PREGUNTAS?
MUCHAS GRACIAS!
[X] CERRAR
Fin de la presentación, haga clic para cerrar. Será si quiero!

Más contenido relacionado

Similar a Big Data & Seguridad

Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Dell EMC
 
Big data y las apis
Big data y  las apis Big data y  las apis
Big data y las apis CloudAppi
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Joseph Lopez
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)pmluque
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Gabriel Eisbruch
 
Microsoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalMicrosoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalJavier Gonzales
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 

Similar a Big Data & Seguridad (20)

Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
 
Big data y las apis
Big data y  las apis Big data y  las apis
Big data y las apis
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
 
BigData
BigDataBigData
BigData
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Que es big data huejutla uaeh
Que es big data huejutla uaehQue es big data huejutla uaeh
Que es big data huejutla uaeh
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Microsoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalMicrosoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación Digital
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 

Último

2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptxccordovato
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfEDUARDO MAMANI MAMANI
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...jhoecabanillas12
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docxmarthaarroyo16
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 

Último (17)

2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 

Big Data & Seguridad

  • 1. BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO
  • 2. PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES antoniogonzalezcastro.esagcastro@pragsis.com linkedin.com/in/agonzaca@agonzaca
  • 3. CONTENIDO ¿Qué es esto del Big Data? ¿Son realmente seguras las plataformas Big Data? ¿Podemos aprovechar esta tecnología en las áreas de seguridad?
  • 4. ¿QUÉ ES ESTO DEL BIG DATA? NO ES SOLO TECNOLOGÍA… Conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios datos encierran. ¿Qué lo hace diferente e innovador? VOLUMEN VARIEDAD VELOCIDAD
  • 5. CRECIMIENTO DE LOS DATOS EN EL MUNDO REAL A DÍA DE HOY El número de dispositivos en red, equivale a la población mundial. EN EL AÑO 2016 x2 Fuente: Intel: What Happens in an Internet Minute? 1m
  • 6. TIPOS DE DATOS SMART DATA Datos referentes al negocio (online/offline). En este grupo podemos encontrar cifras de ventas, estrategia de negocio, datos sobre los clientes, etc. Todo aquello que este relacionado con los objetivos de la empresa. INDENTITY DATA Datos referentes que nos permiten identificar a nuestros clientes actuales, así como datos de sus gustos, historial de compras, interacciones con nuestros contenidos, etc. OPEN DATA Agrupa al resto de datos externos a la empresa y que son accesibles por todo el mundo.
  • 7. ¿UNA MODA? BIG DATA YA ES UNA REALIDAD Las empresas ya están empezando a analizar lo que realmente les interesa: SUS CLIENTES. Empresas como Facebook, Google y Amazon han llegado al éxito gracias a esta tecnología. Ya se esta poniendo un gran foco en desarrollar aquellos productos que el mercado demanda.
  • 8. ALGUNAS EMPRESAS QUE UTILIZAN BIG DATA
  • 9. CAPAS FUNCIONALES DE INTEGRACIÓN TIEMPO REAL REPOSITORIO BIG DATA ANALÍTICA ETL ALMACENAMIENTO PROCESAMIENTO BATCH  Datos estructurados.  Datos no estructurados.  Motor de reglas.  Datos en brutos.  Datos transformados.  Modelos analíticos.  Motor de reglas.
  • 10. TECNOLOGÍA BIG DATA, HADOOP OPEN SOURCE (PROYECTO APACHE)  Almacenar y procesar gran cantidad de datos.  Implementado en JAVA.  Posibilidad de desarrollar en otros lenguajes.  Económico, rápido y eficiente. HDFS  Sistema de archivos distribuido.  Los datos se replican en varias máquinas. MapReduce  Procesamiento por lotes.  Consulta de datos sobre HDFS.  MapReduce + HDFS = Localidad. USUARIO MAPREDUCE HDFS Job Tracker Name Node Data Node & Task Tracker Data Node & Task Tracker Data Node & Task Tracker Data Node & Task Tracker … …
  • 11. ¿POR QUÉ HADOOP FUNCIONA? ESCENARIO TRADICIONAL ESCENARIO HADOOP DATOS DATOS
  • 12. COMPONENTES DE HADOOP ECOSISTEMA HADOOP CORE HADOOP HBase Flume Sqoop Mahout Hive Pig Impala …
  • 13. EL HARDWARE Y EL CÁLCULO DE CAPACIDADES NODOS ESCLAVOS  Procesadores: 2x6 core 2.9 GHz.  Memoria RAM: 48-96 GB.  Red: 10 GB.  Disco Duro: 12x3 TB (NO-RAID) NODOS MAESTROS  Carrier-class.  Dos tarjetas de red.  Disco Duro en RAID.  Dos fuentes de alimentación. POR NODO = ESPACIO EN DISCO / 4
  • 14. SI MUY BIEN, ¿PERO ESTOS DATOS ESTAN SEGUROS? NO!Actualmente existen varios problemas de seguridad AUTENTICACIÓN AUTORIZACIÓN CIFRADO EJECUCIÓN DE CÓDIGO
  • 15. TODO TIENE SOLUCIÓN, ARQUITECTURA SEGURA CONTROL DE ACCESOS CIFRADO DEL TÁFICO DE RED ENMASCARADO DE INFORMACIÓN ARQUITECTURA RED AISLADA
  • 16. SEGURIDAD SOBRE HADOOP AL DETALLE  Kerberos RPC (SASL / GSSAPI) autenticar a los usuarios.  Consolas web HTTP (HTTP SPNEGO) conexiones HTTP.  Tokens de delegación después de la autenticación para evitar carga. AUTENTICACIÓN AUTORIZACIÓN CIFRADO EJECUCIÓN CÓDIGO  Autorización a datos en HDFS a través del NameNode basado en el control de acceso (ACL) de los usuarios y grupos.  Bloque de Tokens (HMAC-SHA1) control de acceso a los bloques de datos.  Conexiones SASL (Kerberos y Autenticación RPC).  Consolas Web y Operaciones MapReduce (SSL).  HDFS Soluciones comerciales.  Se soluciona con los pasos indicados en autorización (Tokens).
  • 17. MENSAJE PARA LOS SECURITY RESEARCHER security@hadoop.apache.org
  • 18. MMM! ¿SI LO UTILIZAMOS PARA SEGURIDAD? CENTRALIZACIÓN DE EVENTOS DETECCIÓN DEL FRAUDE ANÁLISIS FORENSE CIBERVIGILANCIA DETECCIÓN DE AMENAZAS Y ATAQUES
  • 19. CASO DE USO, DETECCIÓN DE FRAUDE DATOS TRANSACIONES PERFIL DE CLIENTE CIBERVIGILANCIA ID CLIENTE / IP ORIGEN / FECHA / TARJETA / CANTIDAD ID CLIENTE / MEDIA CONSUMO / POSICION HABITUAL USUARIOS / TARJETAS ESCENARIO [13/06/2014 10:13:52] [5598CM23 1234567890123457] [80.26.83.175] [150] [13/06/2014 10:43:12] [5598CM23 1234567890123457] [148.245.38.39] [45] [12/06/2014 09:20:35] [5598CM23 1234567890123457] [195.60.81.64] [4900] CUANDO QUIEN DONDE EL QUE
  • 21. MUCHAS GRACIAS! [X] CERRAR Fin de la presentación, haga clic para cerrar. Será si quiero!