3. Historia
1.49 Billion perfiles 4.5 B. likes/mes
300 PB
5 nuevos perfiles c/seg
Cada 60 segundos en facebook:
510 comentarios
293000 estados
136000 fotos
Fuente: https://zephoria.com/top-15-valuable-facebook-statistics/
Octubre 2015
500 M 284 M 200 M
4. Cuan grande son los datos?
• Byte Un grano de arroz
• Kilobyte Una taza de arroz
• Megabyte 8 libras de arroz
• Gigabyte 3 contenedores de camiones
• Terabyte 2 contenedores de barcos
• Petabyte Cubre Manhattan
• Exabyte Cubre UK (3 veces)
• Zettabyte Llena el océano Pacífico
5. Entonces..?
• Estamos generando más datos que nunca
• Transacciones financieras
• Sensores de red
• Logs de aplicaciones
• Correo electrónico y mensajes de texto
• Redes sociales
• Estamos generando nuevos datos más rápido
• Automatización
• Conectividad de internet ubicua
• Contenido
7. Algebra Lineal
Análisis estadístico
Análisis predictivo
Entrenamiento científico
Machine Learning
Minería de datos
Procesamiento de datos &
Bases de datos
Herramientas de BI
Big Data
PHD en:
Ciencias de la Computación?
Estadística?
Física?
Biología?
8. Qué es Data Science?
• Campo multidisciplinario
• Extraer conocimientos o
puntos de vista de los datos
en diversas formas
• Combinación con estadística,
análisis predictivo, minería de
datos, etc.
http://www.datascienceontology.com/
9.
10.
11. Necesitaremos un Data
Scientist?
• Necesitaremos una pelotón de PHDs para resolver
problemas de machine learning?
• Probablemente no.
• Creo que si.
• Podremos encontrar mas valor en los datos que
recogemos?
• Por supuesto!
• Necesitaremos personal que nos ayude a
encontrar ese valor?
12. Puedo convertirme en un
Data Scientist?
• Desarrolladores quienes quieran:
• Orientarse mas por las estadísticas.
• Mejor entendimiento del negocio.
• Analistas de negocio quienes:
• Tenga alguna habilidad para programar.
• Quieran crecer sus capacidades técnicas.
• Todos los candidatos deberían:
• Tener tremenda curiosidad
• Ser auto-manejables.
20. Casos de uso
• Finanzas
• Fraude electrónico
• Riesgo de análisis de un cliente
• Ventas
• Recomendación de productos
• Predecir e incentivar la compra
• Telecomunicaciones y utilidades
• Predecir el fallo de equipos
21. Y más…
• Acelerar el tratamiento para enfermedades
• Uso de Deep Learning sobre registros para
detectar cancer
• Política (Preferencia de votos)
• Ética gubernamental
• Neurociencia