1. Título de la presentación
Subtítulo de la presentación
Texto explicativo
2. Introducción al Big Data
Fecha: 02-Diciembre-2019
Enrique Rendón
Fabian Osorio
Carlos Daniel Jiménez
Programa de Educación Continua y
Permanente
Centro de Investigaciones para el
Desarrollo - CID
Facultad de Ciencias Económicas
8. Big Data
➢En la era de la computación (a la par del abaratamiento de los
dispositivos) el uso de herramientas basadas en sistemas de
información (como el IOT) ha experimentado un crecimiento
exponencial en los últimos años.
➢El telescopio de horizontes de sucesos (EHT), almaceno al
rededor tres años de información y través de técnicas de
machine Learning ( CV & Deep learning) uso 5 petabytes de
información.
➢El ministerio de Salud tiene aproximadamente 460 millones de
registros Anual.
11. • Definición Formal : El Big Data es un término que
hace referencia al estudio de aplicaciones basadas en
set de datos que tienen estructuras complejas y por
ello requieren un software especializado para su
análisis.
• Otra Definición : Es la cantidad de datos que se
producen en un entorno que cuentan con cinco
características principales : Velocidad, Variabilidad,
Volatilidad , Volumen y Veracidad.
Big Data
14. • Clustered Computing: Colección de múltiples
maquinas para procesamiento y poder
computacional.
• Parallel Computing: Desarrollo de múltiples
instrucciones simultáneamente.
• Distribued Computing: Colección de nodos
que se ejecutan en paralelo.
Conceptos y terminologías
15. • Batch Processing: Ejecutar actividades
pequeñas e individuales por máquinas.
• Real Time Processing : Procesamiento
inmediato de los datos.
16. • Hadoop / MapReduce: Técnica de
procesamiento y de computación distribuida
basada en Java.
- Diseña un mapa para trabajar los datos.
- Reduce los procesos de ejecución.
Sistemas de procesamiento con Big Data
17. • Toma secciones de datos y las convierte en
conjuntos, para así diseñar pares de valor.
Mapa de MapReduce
18. • Es un sistema de Cluster Computing que
permite dividir y paralelizar el trabajo a través
de cluster machine.
• Es eficiente en el memory - computation en set
de datos pesados.
• Marco de procesamiento de datos
extremadamente rápido
Apache Spark
22. • El Big Data se usa como una herramienta de
información que permite tomar decisiones más
precisas.
• También tiene un core fuerte en el desarrollo
de machine learning .
Usos
23. • Toma de decisiones: Desarrolle Dashboard
automatizables. Recomendable : Looker.
• Para Machine Learning : Desarrolle featuring
engineering.
Buenas practicas del Big Data
24. Foco en el Big Data analytics
Big Data
Analytics
Describir
Predecir
Prescribir
¿. Qué paso?
¿ Cómo Paso?
¿ Donde?
¿ Cuál es el problema?
Acciones a tomar
¿ Qué podría pasar?
¿ Qué podría pasar si
Se desarrolla A o B plan?
Alternativas para
Mejores resultados
31. Programa de Educación Continua y Permanente
Centro de Investigaciones para el Desarrollo - CID
Facultad de Ciencias Económicas
Páginas web
http://www.cid.unal.edu.co/
http://www.fce.unal.edu.co
Redes sociales
Facebook: Programa de Educación
Continau_FCE-Unal
Twitter: PEC_FCEUnal
Linkedin: PEC_FCEUnal
Teléfonos
+57 3165000 Ext 12306 – 12307
Dirección
Campus Universitario
Edifico 310
Oficina 201
Correo electrónico
uniei_fcebog@unal.edu.co