1. Asignatura:
CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS
UNIDAD I:
FUNDAMENTOS DE CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS
TEMA: Introducción a Ciencia de datos
Docente: Ing. Bertha Mazón, Mg. Inf.
Maestría en Software
2. Agenda
• Introducción a Ciencia de datos
– Evolución
– Definición de Ciencia de datos (DS: Data Science)
– Tipos de análisis de datos
– Disciplinas con las que se relaciona DS
– Ciclo de vida de DS
– Pirámide del conocimiento
– Perfil del científico de datos
3. Objetivo
• Describir terminología y fundamentos de
Ciencia de Datos (DS: Data Science):
evolución, conceptos, tipos de análisis de
datos, ciclo de vida de DS, pirámide del
conocimiento y el científico de datos
4. Evolución de los datos en el mundo
Según International Data Corporation (IDC), el universo digital
en el 2013 fue de 4.4 ZB, en el 2020 alcanzaría un volumen de
44 ZB y 175 ZB en 2025.
5. La era de los datos…
• El universo digital de los datos para el 2020
alcanzaría un volumen de 44 ZB.
• 2,5 quintillones de bytes de datos se crean cada
día.
• El Análisis de datos es una necesidad para
obtener un conocimiento útil de los datos en
bruto.
• Surge entonces una nueva disciplina: La Ciencia
de datos y una nueva profesión: el Científico de
datos y su demanda cada día va en aumento
7. Definición de Ciencia de datos
(DS: Data Science)
• "La extracción de conocimiento útil de los datos para
resolver problemas empresariales mediante un
proceso sistemático con etapas bien definidas"
(Provost & Fawcett, 2013).
• Aplicación de técnicas analíticas avanzadas y
principios científicos para extraer información valiosa
de los datos para la toma de decisiones comerciales,
la planificación estratégica y otros usos.
• La ciencia de los datos nace del método científico y
de la evolución del análisis de datos.
8. Definición de Ciencia de datos
(DS: Data Science)
• "Disciplina que crea sistemas y algoritmos para
descubrir conocimiento, detectar patrones, generar
información útil y/o realizar predicciones a partir de
datos a gran escala" (Molina-Solana, Ros, Dolores Ruiz,
Gomez-Romero, & Martin-Bautista, 2017).
• "Extracción de conocimiento accionable
directamente de los datos a través de un proceso de
descubrimiento o formulación y prueba de hipótesis"
(NIST, 2015).
9. Tipos de análisis de datos
(Gartner, 2012; Loury, 2014; National Academi of Science, 2017; Sivarajah, 2017)
10. Disciplinas con las que se relaciona DS
• La ciencia de datos incluye disciplinas como:
ingeniería de datos, preparación de datos,
minería de datos, análisis predictivo,
aprendizaje automático (machine learning,
ML) y visualización de datos, así como
estadísticas, matemáticas y programación de
software.
15. El Científico de datos
(Data Scientist)
Según (DatiLab, 2017):
• En la actualidad, el científico de datos es uno
de los trabajos bien remunerados.
• El científico de datos es muy demandado en
los países desarrollados y en algunos países de
América Latina como Chile
(https://www.getonbrd.com/)
16. El Científico de datos
Un Data Scientist debe :
• Explorar y analizar datos de múltiples fuentes, a menudo de gran
volumen (conocidas como Big Data), y que pueden tener
formatos muy diferentes.
• Tener una fuerte visión de negocio para ser capaz de obtener
conocimiento de los datos y transmitir recomendaciones a los
responsables de negocio de su empresa.
• Según el Instituto Nacional de Estándares y Tecnología (NIST,
2015), un científico de datos es un profesional con suficiente
conocimiento de las necesidades del negocio, conocimiento del
dominio del problema, habilidades analíticas (estadística,
matemática), manejo de herramientas de software e ingeniería
de sistemas para administrar los procesos de datos.
17. Científico de datos
Competencias Generales del científico de datos:
• Busca flujos eficientes de datos
• Identifica patrones y tendencias en los datos
• Diseña, construye, implementa y optimiza artefactos
de datos
• Trabaja con varias fuentes de datos y de distinto
formato
• Comunica y disemina aportes a la ciencia de datos
• Contribuye en la gestión y mejora del rendimiento de
un negocio
23. Referencias Bibliográficas
• Provost, F., & Fawcett, T. (2013). Data Science for Business. What you need to know about Data Mining and
Data-Analytic thinking. O’Reilly Media.
• Naur, P. (1974). Concise Survey of Computer Methods. Lund: Studentlitteratur.
• NIST. (2015). NIST Special Publication 1500-1 NIST. Big Data Interoperability Framework : Volume 1 ,
Definitions. National Institute of Standards and Technology, 1, 32. http://doi.org/10.6028/NIST.SP.1500-1
• Gartner. (2012). Analytic Ascendancy Model. Retrieved December 12, 2017, from
http://www.growwithfarm.com/evolving-analytics-from-descriptive-to-prescriptive/
• Loury, J. (2014). Evolving Analytics: From Descriptive to Prescriptive. Retrieved December 11, 2017, from
http://www.growwithfarm.com/evolving-analytics-from-descriptive-to-prescriptive/
• National Academi of Science. (2017). Overview of Data Science Methods. In Strengthening Data Science
Methods for Department of Defense Personnel and Readiness Missions (pp. 53–79). The National
Academies Press. http://doi.org/10.17226/23670
• Sivarajah, U. et al. (2017). Critical analysis of Big Data challenges and analytical methods. Journal of
Business Research, 70, 263–286. http://doi.org/10.1016/J.JBUSRES.2016.08.001
• Larson, D., & Chang, V. (2016). International Journal of Information Management A review and future
direction of agile , business intelligence , analytics and data science. International Journal of Information
Management, 36(5), 700–710. http://doi.org/10.1016/j.ijinfomgt.2016.04.013
• https://www.networkworld.com/article/3325397/idc-expect-175-zettabytes-of-data-worldwide-by-
2025.html
• Molina-Solana, M., Ros, M., Dolores Ruiz, M., Gomez-Romero, J., & Martin-Bautista, M. J. (2017). Data
science for building energy management: A review. Renewable & Sustainable Energy Reviews,
70(December 2016), 598–609. http://doi.org/10.1016/j.rser.2016.11.132