SlideShare una empresa de Scribd logo
1 de 21
BIG DATA & SEGURIDAD
UN MATRIMONIO DE FUTURO
PRESENTACIÓN
ANTONIO GONZÁLEZ CASTRO
IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES
antoniogonzalezcastro.esagcastro@pragsis.com
linkedin.com/in/agonzaca@agonzaca
CONTENIDO
¿Qué es esto del Big Data?
¿Son realmente seguras las plataformas Big Data?
¿Podemos aprovechar esta tecnología en las áreas de seguridad?
¿QUÉ ES ESTO DEL BIG DATA?
NO ES SOLO TECNOLOGÍA…
Conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en
capturar el valor que los propios datos encierran.
¿Qué lo hace diferente e innovador?
VOLUMEN VARIEDAD VELOCIDAD
CRECIMIENTO DE LOS DATOS EN EL MUNDO REAL
A DÍA DE HOY
El número de dispositivos en red,
equivale a la población mundial.
EN EL AÑO 2016
x2
Fuente: Intel: What Happens in an Internet Minute?
1m
TIPOS DE DATOS
SMART DATA
Datos referentes al negocio (online/offline). En este grupo podemos encontrar cifras de ventas,
estrategia de negocio, datos sobre los clientes, etc. Todo aquello que este relacionado con los
objetivos de la empresa.
INDENTITY DATA
Datos referentes que nos permiten identificar a nuestros clientes actuales, así como datos de sus
gustos, historial de compras, interacciones con nuestros contenidos, etc.
OPEN DATA
Agrupa al resto de datos externos a la empresa y que son accesibles por todo el mundo.
¿UNA MODA?
BIG DATA YA ES UNA REALIDAD
Las empresas ya están empezando a analizar lo que realmente les interesa: SUS CLIENTES.
Empresas como Facebook, Google y Amazon han llegado al éxito
gracias a esta tecnología.
Ya se esta poniendo un gran foco en desarrollar aquellos productos que el mercado demanda.
ALGUNAS EMPRESAS QUE UTILIZAN BIG DATA
CAPAS FUNCIONALES DE INTEGRACIÓN
TIEMPO REAL
REPOSITORIO BIG DATA
ANALÍTICA
ETL
ALMACENAMIENTO
PROCESAMIENTO BATCH
 Datos estructurados.
 Datos no estructurados.
 Motor de reglas.
 Datos en brutos.
 Datos transformados.
 Modelos analíticos.
 Motor de reglas.
TECNOLOGÍA BIG DATA, HADOOP
OPEN SOURCE (PROYECTO APACHE)
 Almacenar y procesar gran cantidad de datos.
 Implementado en JAVA.
 Posibilidad de desarrollar en otros lenguajes.
 Económico, rápido y eficiente.
HDFS
 Sistema de archivos distribuido.
 Los datos se replican en varias máquinas.
MapReduce
 Procesamiento por lotes.
 Consulta de datos sobre HDFS.
 MapReduce + HDFS = Localidad.
USUARIO
MAPREDUCE HDFS
Job Tracker Name Node
Data Node &
Task Tracker
Data Node &
Task Tracker
Data Node &
Task Tracker
Data Node &
Task Tracker
…
…
¿POR QUÉ HADOOP FUNCIONA?
ESCENARIO TRADICIONAL ESCENARIO HADOOP
DATOS DATOS
COMPONENTES DE HADOOP
ECOSISTEMA
HADOOP
CORE
HADOOP
HBase Flume Sqoop Mahout
Hive Pig Impala …
EL HARDWARE Y EL CÁLCULO DE CAPACIDADES
NODOS ESCLAVOS
 Procesadores: 2x6 core 2.9 GHz.
 Memoria RAM: 48-96 GB.
 Red: 10 GB.
 Disco Duro: 12x3 TB (NO-RAID)
NODOS MAESTROS
 Carrier-class.
 Dos tarjetas de red.
 Disco Duro en RAID.
 Dos fuentes de alimentación.
POR NODO = ESPACIO EN DISCO / 4
SI MUY BIEN, ¿PERO ESTOS DATOS ESTAN SEGUROS?
NO!Actualmente existen varios problemas de seguridad
AUTENTICACIÓN AUTORIZACIÓN
CIFRADO EJECUCIÓN DE CÓDIGO
TODO TIENE SOLUCIÓN, ARQUITECTURA SEGURA
CONTROL DE ACCESOS
CIFRADO DEL TÁFICO DE RED
ENMASCARADO DE INFORMACIÓN
ARQUITECTURA RED AISLADA
SEGURIDAD SOBRE HADOOP AL DETALLE
 Kerberos RPC (SASL / GSSAPI) autenticar a los usuarios.
 Consolas web HTTP (HTTP SPNEGO) conexiones HTTP.
 Tokens de delegación después de la autenticación para evitar carga.
AUTENTICACIÓN
AUTORIZACIÓN
CIFRADO
EJECUCIÓN CÓDIGO
 Autorización a datos en HDFS a través del NameNode basado en el
control de acceso (ACL) de los usuarios y grupos.
 Bloque de Tokens (HMAC-SHA1) control de acceso a los bloques de datos.
 Conexiones SASL (Kerberos y Autenticación RPC).
 Consolas Web y Operaciones MapReduce (SSL).
 HDFS Soluciones comerciales.
 Se soluciona con los pasos indicados en autorización (Tokens).
MENSAJE PARA LOS SECURITY RESEARCHER
security@hadoop.apache.org
MMM! ¿SI LO UTILIZAMOS PARA SEGURIDAD?
CENTRALIZACIÓN DE EVENTOS
DETECCIÓN DEL FRAUDE
ANÁLISIS FORENSE
CIBERVIGILANCIA
DETECCIÓN DE AMENAZAS Y ATAQUES
CASO DE USO, DETECCIÓN DE FRAUDE
DATOS
TRANSACIONES
PERFIL DE CLIENTE
CIBERVIGILANCIA
ID CLIENTE / IP ORIGEN / FECHA / TARJETA / CANTIDAD
ID CLIENTE / MEDIA CONSUMO / POSICION HABITUAL
USUARIOS / TARJETAS
ESCENARIO
[13/06/2014 10:13:52] [5598CM23 1234567890123457] [80.26.83.175] [150]
[13/06/2014 10:43:12] [5598CM23 1234567890123457] [148.245.38.39] [45]
[12/06/2014 09:20:35] [5598CM23 1234567890123457] [195.60.81.64] [4900]
CUANDO QUIEN DONDE
EL QUE
¿PREGUNTAS?
MUCHAS GRACIAS!
[X] CERRAR
Fin de la presentación, haga clic para cerrar. Será si quiero!

Más contenido relacionado

Similar a Big Data & Seguridad

Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Dell EMC
 
Big data y las apis
Big data y  las apis Big data y  las apis
Big data y las apis CloudAppi
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Joseph Lopez
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)pmluque
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Gabriel Eisbruch
 
Microsoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalMicrosoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalJavier Gonzales
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 

Similar a Big Data & Seguridad (20)

Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
 
Big data y las apis
Big data y  las apis Big data y  las apis
Big data y las apis
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
 
BigData
BigDataBigData
BigData
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Que es big data huejutla uaeh
Que es big data huejutla uaehQue es big data huejutla uaeh
Que es big data huejutla uaeh
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Microsoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalMicrosoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación Digital
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 

Último

Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 

Último (20)

Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 

Big Data & Seguridad

  • 1. BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO
  • 2. PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES antoniogonzalezcastro.esagcastro@pragsis.com linkedin.com/in/agonzaca@agonzaca
  • 3. CONTENIDO ¿Qué es esto del Big Data? ¿Son realmente seguras las plataformas Big Data? ¿Podemos aprovechar esta tecnología en las áreas de seguridad?
  • 4. ¿QUÉ ES ESTO DEL BIG DATA? NO ES SOLO TECNOLOGÍA… Conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios datos encierran. ¿Qué lo hace diferente e innovador? VOLUMEN VARIEDAD VELOCIDAD
  • 5. CRECIMIENTO DE LOS DATOS EN EL MUNDO REAL A DÍA DE HOY El número de dispositivos en red, equivale a la población mundial. EN EL AÑO 2016 x2 Fuente: Intel: What Happens in an Internet Minute? 1m
  • 6. TIPOS DE DATOS SMART DATA Datos referentes al negocio (online/offline). En este grupo podemos encontrar cifras de ventas, estrategia de negocio, datos sobre los clientes, etc. Todo aquello que este relacionado con los objetivos de la empresa. INDENTITY DATA Datos referentes que nos permiten identificar a nuestros clientes actuales, así como datos de sus gustos, historial de compras, interacciones con nuestros contenidos, etc. OPEN DATA Agrupa al resto de datos externos a la empresa y que son accesibles por todo el mundo.
  • 7. ¿UNA MODA? BIG DATA YA ES UNA REALIDAD Las empresas ya están empezando a analizar lo que realmente les interesa: SUS CLIENTES. Empresas como Facebook, Google y Amazon han llegado al éxito gracias a esta tecnología. Ya se esta poniendo un gran foco en desarrollar aquellos productos que el mercado demanda.
  • 8. ALGUNAS EMPRESAS QUE UTILIZAN BIG DATA
  • 9. CAPAS FUNCIONALES DE INTEGRACIÓN TIEMPO REAL REPOSITORIO BIG DATA ANALÍTICA ETL ALMACENAMIENTO PROCESAMIENTO BATCH  Datos estructurados.  Datos no estructurados.  Motor de reglas.  Datos en brutos.  Datos transformados.  Modelos analíticos.  Motor de reglas.
  • 10. TECNOLOGÍA BIG DATA, HADOOP OPEN SOURCE (PROYECTO APACHE)  Almacenar y procesar gran cantidad de datos.  Implementado en JAVA.  Posibilidad de desarrollar en otros lenguajes.  Económico, rápido y eficiente. HDFS  Sistema de archivos distribuido.  Los datos se replican en varias máquinas. MapReduce  Procesamiento por lotes.  Consulta de datos sobre HDFS.  MapReduce + HDFS = Localidad. USUARIO MAPREDUCE HDFS Job Tracker Name Node Data Node & Task Tracker Data Node & Task Tracker Data Node & Task Tracker Data Node & Task Tracker … …
  • 11. ¿POR QUÉ HADOOP FUNCIONA? ESCENARIO TRADICIONAL ESCENARIO HADOOP DATOS DATOS
  • 12. COMPONENTES DE HADOOP ECOSISTEMA HADOOP CORE HADOOP HBase Flume Sqoop Mahout Hive Pig Impala …
  • 13. EL HARDWARE Y EL CÁLCULO DE CAPACIDADES NODOS ESCLAVOS  Procesadores: 2x6 core 2.9 GHz.  Memoria RAM: 48-96 GB.  Red: 10 GB.  Disco Duro: 12x3 TB (NO-RAID) NODOS MAESTROS  Carrier-class.  Dos tarjetas de red.  Disco Duro en RAID.  Dos fuentes de alimentación. POR NODO = ESPACIO EN DISCO / 4
  • 14. SI MUY BIEN, ¿PERO ESTOS DATOS ESTAN SEGUROS? NO!Actualmente existen varios problemas de seguridad AUTENTICACIÓN AUTORIZACIÓN CIFRADO EJECUCIÓN DE CÓDIGO
  • 15. TODO TIENE SOLUCIÓN, ARQUITECTURA SEGURA CONTROL DE ACCESOS CIFRADO DEL TÁFICO DE RED ENMASCARADO DE INFORMACIÓN ARQUITECTURA RED AISLADA
  • 16. SEGURIDAD SOBRE HADOOP AL DETALLE  Kerberos RPC (SASL / GSSAPI) autenticar a los usuarios.  Consolas web HTTP (HTTP SPNEGO) conexiones HTTP.  Tokens de delegación después de la autenticación para evitar carga. AUTENTICACIÓN AUTORIZACIÓN CIFRADO EJECUCIÓN CÓDIGO  Autorización a datos en HDFS a través del NameNode basado en el control de acceso (ACL) de los usuarios y grupos.  Bloque de Tokens (HMAC-SHA1) control de acceso a los bloques de datos.  Conexiones SASL (Kerberos y Autenticación RPC).  Consolas Web y Operaciones MapReduce (SSL).  HDFS Soluciones comerciales.  Se soluciona con los pasos indicados en autorización (Tokens).
  • 17. MENSAJE PARA LOS SECURITY RESEARCHER security@hadoop.apache.org
  • 18. MMM! ¿SI LO UTILIZAMOS PARA SEGURIDAD? CENTRALIZACIÓN DE EVENTOS DETECCIÓN DEL FRAUDE ANÁLISIS FORENSE CIBERVIGILANCIA DETECCIÓN DE AMENAZAS Y ATAQUES
  • 19. CASO DE USO, DETECCIÓN DE FRAUDE DATOS TRANSACIONES PERFIL DE CLIENTE CIBERVIGILANCIA ID CLIENTE / IP ORIGEN / FECHA / TARJETA / CANTIDAD ID CLIENTE / MEDIA CONSUMO / POSICION HABITUAL USUARIOS / TARJETAS ESCENARIO [13/06/2014 10:13:52] [5598CM23 1234567890123457] [80.26.83.175] [150] [13/06/2014 10:43:12] [5598CM23 1234567890123457] [148.245.38.39] [45] [12/06/2014 09:20:35] [5598CM23 1234567890123457] [195.60.81.64] [4900] CUANDO QUIEN DONDE EL QUE
  • 21. MUCHAS GRACIAS! [X] CERRAR Fin de la presentación, haga clic para cerrar. Será si quiero!