Este documento define Big Data y describe cómo se capturan, almacenan y analizan grandes cantidades de datos provenientes de múltiples fuentes como transacciones, dispositivos conectados y biometría. Explica que el Big Data se usa para entender mejor a los clientes, optimizar procesos, mejorar la investigación y más a través de técnicas como minería de datos, agrupamiento y visualización.
3. BIG DATA
Definición:
Este termino hace referencia a una cantidad de datos que supera la capacidad del
software convencional para ser administrados en un tiempo razonable.
Se crea para almacenar grandes cantidades de datos masivos y que estos sigan en
su anonimato.
4.
5.
6. CAPTURA
TRANSACCIONES DE DATOS: las transacciones entre cuentas genera
información que tratada puede ser datos relevantes
MAQUINA A MAQUINA: son las tecnologías que comparten datos con
dispositivos y transforman las magnitudes físicas o químicas y las convierte
en datos
BIOMETRICA: son cantidades de datos generados por lectores biométricos
como escáneres de retina o escáner de huella digital
7. TRANSFORMACIÓN
Se usa con el fin de almacenar los datos encontrados de diferentes fuentes en
solo un lugar o espacio; donde entran en juego las plataformas de extraer,
transformar y cargar (ETL). El ejemplo más claro de este es el pentaho Data
Integration, más específico la app Spoon.
8.
9. Almacenamiento clave-valor: los datos se almacenan de forma similar a los
mapas o diccionarios de datos, donde se accede al dato a partir de una clave
única
Almacenamiento documental: todos los documentos tiene una clave única
con la que pueden ser accedidos e identificados explícitamente
Almacenamiento en grafo: rompen con la idea de tabla y se basan con la teoría
de grafos donde se establece que la información son los nodos y las relaciones
entre la información son las aristas
Almacenamiento orientado a columna: este almacenamiento es parecido al
documental su modelo de datos es definido como un mapa de datos
multidimensional poco denso distribuido y persistente
Almacenamiento
10.
11. Análisis de datos
Asociación: Permite la relación entre las variable, gracias a ella se genera la
predicción de las mismas estas predicciones se dan en las ventas cruzadas
en los comercios electrónicos.
Minería de datos: Su objetivo es tener comportamientos predictivos
conectando métodos estadísticos y de aprendizaje automático con
almacenamiento en bases de datos.
Agrupación: Con el análisis de clústeres genera la agrupación de grupos
pequeños y grandes mostrando un parecido del que no sabíamos.
En base a los correos, búsquedas web o contenidos; esta metodología
permite extraer información de estos datos y modelar temas y asuntos o
predecir palabras.
12. Visualización de datos
La visualización de datos se resume en llegar a las personas de una forma
dinámica, exponiendo las bases de datos y estadísticas de maneras
multidimensionales. Se quiere generar una rica experiencia visual ya que
así se genera más percepción de el tema a tratar.
13. Ejemplos de big data
Entendiendo y segmentando a los clientes
Entendiendo y optimizando los procesos de los clientes
Cuantificación y optimización de los clientes de rendimiento personal
Mejorando la salud publica
Mejorando el rendimiento deportivo
Mejorando la ciencia y la investigación
Optimizando el rendimiento de maquinas y dispositivos
Mejorando la seguridad y el cumplimiento de la ley
Mejorando y optimizando las ciudades
Trading financiero
14. Datos curiosos
En el 2016, se invirtieron nada más y nada menos que 216 millones de
dólares en proyectos de Big Data.
4,4 millones de trabajos en tecnologías de la información fueron creados
en el año 2015 para el soporte y la manutención del Big Data.
En el 2020 se almacenarán más de 35 Zettabytes (1015 GB) de información
en la nube.
Cada día se almacenan más de 100 Terabytes (106 GB) de información
solamente a través de Facebook.