SlideShare una empresa de Scribd logo
1 de 23
Asignatura:
CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS
UNIDAD I:
FUNDAMENTOS DE CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS
TEMA: Introducción a Ciencia de datos
Docente: Ing. Bertha Mazón, Mg. Inf.
Maestría en Software
Agenda
• Introducción a Ciencia de datos
– Evolución
– Definición de Ciencia de datos (DS: Data Science)
– Tipos de análisis de datos
– Disciplinas con las que se relaciona DS
– Ciclo de vida de DS
– Pirámide del conocimiento
– Perfil del científico de datos
Objetivo
• Describir terminología y fundamentos de
Ciencia de Datos (DS: Data Science):
evolución, conceptos, tipos de análisis de
datos, ciclo de vida de DS, pirámide del
conocimiento y el científico de datos
Evolución de los datos en el mundo
Según International Data Corporation (IDC), el universo digital
en el 2013 fue de 4.4 ZB, en el 2020 alcanzaría un volumen de
44 ZB y 175 ZB en 2025.
La era de los datos…
• El universo digital de los datos para el 2020
alcanzaría un volumen de 44 ZB.
• 2,5 quintillones de bytes de datos se crean cada
día.
• El Análisis de datos es una necesidad para
obtener un conocimiento útil de los datos en
bruto.
• Surge entonces una nueva disciplina: La Ciencia
de datos y una nueva profesión: el Científico de
datos y su demanda cada día va en aumento
Evolución de Ciencia de Datos
Definición de Ciencia de datos
(DS: Data Science)
• "La extracción de conocimiento útil de los datos para
resolver problemas empresariales mediante un
proceso sistemático con etapas bien definidas"
(Provost & Fawcett, 2013).
• Aplicación de técnicas analíticas avanzadas y
principios científicos para extraer información valiosa
de los datos para la toma de decisiones comerciales,
la planificación estratégica y otros usos.
• La ciencia de los datos nace del método científico y
de la evolución del análisis de datos.
Definición de Ciencia de datos
(DS: Data Science)
• "Disciplina que crea sistemas y algoritmos para
descubrir conocimiento, detectar patrones, generar
información útil y/o realizar predicciones a partir de
datos a gran escala" (Molina-Solana, Ros, Dolores Ruiz,
Gomez-Romero, & Martin-Bautista, 2017).
• "Extracción de conocimiento accionable
directamente de los datos a través de un proceso de
descubrimiento o formulación y prueba de hipótesis"
(NIST, 2015).
Tipos de análisis de datos
(Gartner, 2012; Loury, 2014; National Academi of Science, 2017; Sivarajah, 2017)
Disciplinas con las que se relaciona DS
• La ciencia de datos incluye disciplinas como:
ingeniería de datos, preparación de datos,
minería de datos, análisis predictivo,
aprendizaje automático (machine learning,
ML) y visualización de datos, así como
estadísticas, matemáticas y programación de
software.
Disciplinas con las que se relaciona DS
Disciplinas más destacadas de DS
Ciclo de vida de DS
(Larson & Chang, 2016; Provost & Fawcett, 2013)
Pirámide del conocimiento
El Científico de datos
(Data Scientist)
Según (DatiLab, 2017):
• En la actualidad, el científico de datos es uno
de los trabajos bien remunerados.
• El científico de datos es muy demandado en
los países desarrollados y en algunos países de
América Latina como Chile
(https://www.getonbrd.com/)
El Científico de datos
Un Data Scientist debe :
• Explorar y analizar datos de múltiples fuentes, a menudo de gran
volumen (conocidas como Big Data), y que pueden tener
formatos muy diferentes.
• Tener una fuerte visión de negocio para ser capaz de obtener
conocimiento de los datos y transmitir recomendaciones a los
responsables de negocio de su empresa.
• Según el Instituto Nacional de Estándares y Tecnología (NIST,
2015), un científico de datos es un profesional con suficiente
conocimiento de las necesidades del negocio, conocimiento del
dominio del problema, habilidades analíticas (estadística,
matemática), manejo de herramientas de software e ingeniería
de sistemas para administrar los procesos de datos.
Científico de datos
Competencias Generales del científico de datos:
• Busca flujos eficientes de datos
• Identifica patrones y tendencias en los datos
• Diseña, construye, implementa y optimiza artefactos
de datos
• Trabaja con varias fuentes de datos y de distinto
formato
• Comunica y disemina aportes a la ciencia de datos
• Contribuye en la gestión y mejora del rendimiento de
un negocio
Herramientas de los profesionales de los datos
Más herramientas…
Más herramientas…
Referencias Bibliográficas
• Provost, F., & Fawcett, T. (2013). Data Science for Business. What you need to know about Data Mining and
Data-Analytic thinking. O’Reilly Media.
• Naur, P. (1974). Concise Survey of Computer Methods. Lund: Studentlitteratur.
• NIST. (2015). NIST Special Publication 1500-1 NIST. Big Data Interoperability Framework : Volume 1 ,
Definitions. National Institute of Standards and Technology, 1, 32. http://doi.org/10.6028/NIST.SP.1500-1
• Gartner. (2012). Analytic Ascendancy Model. Retrieved December 12, 2017, from
http://www.growwithfarm.com/evolving-analytics-from-descriptive-to-prescriptive/
• Loury, J. (2014). Evolving Analytics: From Descriptive to Prescriptive. Retrieved December 11, 2017, from
http://www.growwithfarm.com/evolving-analytics-from-descriptive-to-prescriptive/
• National Academi of Science. (2017). Overview of Data Science Methods. In Strengthening Data Science
Methods for Department of Defense Personnel and Readiness Missions (pp. 53–79). The National
Academies Press. http://doi.org/10.17226/23670
• Sivarajah, U. et al. (2017). Critical analysis of Big Data challenges and analytical methods. Journal of
Business Research, 70, 263–286. http://doi.org/10.1016/J.JBUSRES.2016.08.001
• Larson, D., & Chang, V. (2016). International Journal of Information Management A review and future
direction of agile , business intelligence , analytics and data science. International Journal of Information
Management, 36(5), 700–710. http://doi.org/10.1016/j.ijinfomgt.2016.04.013
• https://www.networkworld.com/article/3325397/idc-expect-175-zettabytes-of-data-worldwide-by-
2025.html
• Molina-Solana, M., Ros, M., Dolores Ruiz, M., Gomez-Romero, J., & Martin-Bautista, M. J. (2017). Data
science for building energy management: A review. Renewable & Sustainable Energy Reviews,
70(December 2016), 598–609. http://doi.org/10.1016/j.rser.2016.11.132

Más contenido relacionado

La actualidad más candente

Banco de dados - Aula 1 SQL
Banco de dados - Aula 1 SQLBanco de dados - Aula 1 SQL
Banco de dados - Aula 1 SQLDaniel Brandão
 
Electronica Digital
Electronica DigitalElectronica Digital
Electronica Digitalchisco1967
 
Modelos Prescriptivos del Desarrollo del Sistema de Información
Modelos Prescriptivos del Desarrollo del Sistema de InformaciónModelos Prescriptivos del Desarrollo del Sistema de Información
Modelos Prescriptivos del Desarrollo del Sistema de InformaciónIsaias Toledo
 
Modelos de banco de dados
Modelos de banco de dadosModelos de banco de dados
Modelos de banco de dadosEdgar Stuart
 
Laporan praktikum modul 8 (dml part 2)
Laporan praktikum modul 8 (dml part 2)Laporan praktikum modul 8 (dml part 2)
Laporan praktikum modul 8 (dml part 2)Devi Apriansyah
 
Introduction to SQL
Introduction to SQLIntroduction to SQL
Introduction to SQLRam Kedem
 
PROGRAMACION ORIENTADA A OBJETOS
PROGRAMACION ORIENTADA A OBJETOSPROGRAMACION ORIENTADA A OBJETOS
PROGRAMACION ORIENTADA A OBJETOSMayri85
 
SQL - DML and DDL Commands
SQL - DML and DDL CommandsSQL - DML and DDL Commands
SQL - DML and DDL CommandsShrija Madhu
 
Fundamentos de Programacion - Unidad 5 arreglos (vectores)
Fundamentos de Programacion - Unidad 5 arreglos (vectores)Fundamentos de Programacion - Unidad 5 arreglos (vectores)
Fundamentos de Programacion - Unidad 5 arreglos (vectores)José Antonio Sandoval Acosta
 
Tipos de consultas sql
Tipos de consultas sqlTipos de consultas sql
Tipos de consultas sqlFausto Torres
 
Estructura de almacenamiento
Estructura de almacenamientoEstructura de almacenamiento
Estructura de almacenamientoAndrea Mendez
 

La actualidad más candente (20)

Banco de dados - Aula 1 SQL
Banco de dados - Aula 1 SQLBanco de dados - Aula 1 SQL
Banco de dados - Aula 1 SQL
 
SQL DDL
SQL DDLSQL DDL
SQL DDL
 
SQL_NOTES.pdf
SQL_NOTES.pdfSQL_NOTES.pdf
SQL_NOTES.pdf
 
Electronica Digital
Electronica DigitalElectronica Digital
Electronica Digital
 
Modelos Prescriptivos del Desarrollo del Sistema de Información
Modelos Prescriptivos del Desarrollo del Sistema de InformaciónModelos Prescriptivos del Desarrollo del Sistema de Información
Modelos Prescriptivos del Desarrollo del Sistema de Información
 
Modelos de banco de dados
Modelos de banco de dadosModelos de banco de dados
Modelos de banco de dados
 
Sql.pptx
Sql.pptxSql.pptx
Sql.pptx
 
Laporan praktikum modul 8 (dml part 2)
Laporan praktikum modul 8 (dml part 2)Laporan praktikum modul 8 (dml part 2)
Laporan praktikum modul 8 (dml part 2)
 
Introduction to SQL
Introduction to SQLIntroduction to SQL
Introduction to SQL
 
Conceptos basicos de analisis y diseño
Conceptos basicos de analisis y diseñoConceptos basicos de analisis y diseño
Conceptos basicos de analisis y diseño
 
PROGRAMACION ORIENTADA A OBJETOS
PROGRAMACION ORIENTADA A OBJETOSPROGRAMACION ORIENTADA A OBJETOS
PROGRAMACION ORIENTADA A OBJETOS
 
ADO .NET
ADO .NETADO .NET
ADO .NET
 
SQL - DML and DDL Commands
SQL - DML and DDL CommandsSQL - DML and DDL Commands
SQL - DML and DDL Commands
 
Java con base de datos
Java con base de datosJava con base de datos
Java con base de datos
 
Fundamentos de Programacion - Unidad 5 arreglos (vectores)
Fundamentos de Programacion - Unidad 5 arreglos (vectores)Fundamentos de Programacion - Unidad 5 arreglos (vectores)
Fundamentos de Programacion - Unidad 5 arreglos (vectores)
 
Introduction to-sql
Introduction to-sqlIntroduction to-sql
Introduction to-sql
 
Tipos de consultas sql
Tipos de consultas sqlTipos de consultas sql
Tipos de consultas sql
 
Estructura de almacenamiento
Estructura de almacenamientoEstructura de almacenamiento
Estructura de almacenamiento
 
Comandos básicos mysql
Comandos básicos mysqlComandos básicos mysql
Comandos básicos mysql
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datos
 

Similar a 1.Unidad1. Fundamentos DataScience.pptx

Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Big Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasBig Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasLuis Felipe Tabares Pérez
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigaciónFernando-Ariel Lopez
 
Conociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y JoyanesConociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y Joyanesjacristancho
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasFelipe Vera (Prodigio Consultores)
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdfDarnelyC
 
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...Julio Alonso Arévalo
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big datapedro_juanes
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresUniversidad Nacional del Nordeste
 
Data science como motor de la innovación
Data science como motor de la innovaciónData science como motor de la innovación
Data science como motor de la innovaciónRoberto Muñoz
 

Similar a 1.Unidad1. Fundamentos DataScience.pptx (20)

Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Matemática y Data Science
Matemática y Data ScienceMatemática y Data Science
Matemática y Data Science
 
Big Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasBig Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y Tendencias
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
Conociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y JoyanesConociendo el bigdata por Camargo y Joyanes
Conociendo el bigdata por Camargo y Joyanes
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecas
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
PLANES Panamá v.3.1
PLANES Panamá v.3.1PLANES Panamá v.3.1
PLANES Panamá v.3.1
 
Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)
 
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big data
 
Curso "Buenas prácticas en Gestión de datos en Ciencias Sociales y Humanidades"
Curso "Buenas prácticas en Gestión de datos en Ciencias Sociales y Humanidades"Curso "Buenas prácticas en Gestión de datos en Ciencias Sociales y Humanidades"
Curso "Buenas prácticas en Gestión de datos en Ciencias Sociales y Humanidades"
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Data Science: Correlación curricular
Data Science: Correlación curricularData Science: Correlación curricular
Data Science: Correlación curricular
 
Data science como motor de la innovación
Data science como motor de la innovaciónData science como motor de la innovación
Data science como motor de la innovación
 
Data mining
Data miningData mining
Data mining
 
IDAL 2023 FGallego
IDAL 2023 FGallegoIDAL 2023 FGallego
IDAL 2023 FGallego
 
Infotecnología
InfotecnologíaInfotecnología
Infotecnología
 

1.Unidad1. Fundamentos DataScience.pptx

  • 1. Asignatura: CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS UNIDAD I: FUNDAMENTOS DE CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS TEMA: Introducción a Ciencia de datos Docente: Ing. Bertha Mazón, Mg. Inf. Maestría en Software
  • 2. Agenda • Introducción a Ciencia de datos – Evolución – Definición de Ciencia de datos (DS: Data Science) – Tipos de análisis de datos – Disciplinas con las que se relaciona DS – Ciclo de vida de DS – Pirámide del conocimiento – Perfil del científico de datos
  • 3. Objetivo • Describir terminología y fundamentos de Ciencia de Datos (DS: Data Science): evolución, conceptos, tipos de análisis de datos, ciclo de vida de DS, pirámide del conocimiento y el científico de datos
  • 4. Evolución de los datos en el mundo Según International Data Corporation (IDC), el universo digital en el 2013 fue de 4.4 ZB, en el 2020 alcanzaría un volumen de 44 ZB y 175 ZB en 2025.
  • 5. La era de los datos… • El universo digital de los datos para el 2020 alcanzaría un volumen de 44 ZB. • 2,5 quintillones de bytes de datos se crean cada día. • El Análisis de datos es una necesidad para obtener un conocimiento útil de los datos en bruto. • Surge entonces una nueva disciplina: La Ciencia de datos y una nueva profesión: el Científico de datos y su demanda cada día va en aumento
  • 7. Definición de Ciencia de datos (DS: Data Science) • "La extracción de conocimiento útil de los datos para resolver problemas empresariales mediante un proceso sistemático con etapas bien definidas" (Provost & Fawcett, 2013). • Aplicación de técnicas analíticas avanzadas y principios científicos para extraer información valiosa de los datos para la toma de decisiones comerciales, la planificación estratégica y otros usos. • La ciencia de los datos nace del método científico y de la evolución del análisis de datos.
  • 8. Definición de Ciencia de datos (DS: Data Science) • "Disciplina que crea sistemas y algoritmos para descubrir conocimiento, detectar patrones, generar información útil y/o realizar predicciones a partir de datos a gran escala" (Molina-Solana, Ros, Dolores Ruiz, Gomez-Romero, & Martin-Bautista, 2017). • "Extracción de conocimiento accionable directamente de los datos a través de un proceso de descubrimiento o formulación y prueba de hipótesis" (NIST, 2015).
  • 9. Tipos de análisis de datos (Gartner, 2012; Loury, 2014; National Academi of Science, 2017; Sivarajah, 2017)
  • 10. Disciplinas con las que se relaciona DS • La ciencia de datos incluye disciplinas como: ingeniería de datos, preparación de datos, minería de datos, análisis predictivo, aprendizaje automático (machine learning, ML) y visualización de datos, así como estadísticas, matemáticas y programación de software.
  • 11. Disciplinas con las que se relaciona DS
  • 13. Ciclo de vida de DS (Larson & Chang, 2016; Provost & Fawcett, 2013)
  • 15. El Científico de datos (Data Scientist) Según (DatiLab, 2017): • En la actualidad, el científico de datos es uno de los trabajos bien remunerados. • El científico de datos es muy demandado en los países desarrollados y en algunos países de América Latina como Chile (https://www.getonbrd.com/)
  • 16. El Científico de datos Un Data Scientist debe : • Explorar y analizar datos de múltiples fuentes, a menudo de gran volumen (conocidas como Big Data), y que pueden tener formatos muy diferentes. • Tener una fuerte visión de negocio para ser capaz de obtener conocimiento de los datos y transmitir recomendaciones a los responsables de negocio de su empresa. • Según el Instituto Nacional de Estándares y Tecnología (NIST, 2015), un científico de datos es un profesional con suficiente conocimiento de las necesidades del negocio, conocimiento del dominio del problema, habilidades analíticas (estadística, matemática), manejo de herramientas de software e ingeniería de sistemas para administrar los procesos de datos.
  • 17. Científico de datos Competencias Generales del científico de datos: • Busca flujos eficientes de datos • Identifica patrones y tendencias en los datos • Diseña, construye, implementa y optimiza artefactos de datos • Trabaja con varias fuentes de datos y de distinto formato • Comunica y disemina aportes a la ciencia de datos • Contribuye en la gestión y mejora del rendimiento de un negocio
  • 18.
  • 19.
  • 20. Herramientas de los profesionales de los datos
  • 23. Referencias Bibliográficas • Provost, F., & Fawcett, T. (2013). Data Science for Business. What you need to know about Data Mining and Data-Analytic thinking. O’Reilly Media. • Naur, P. (1974). Concise Survey of Computer Methods. Lund: Studentlitteratur. • NIST. (2015). NIST Special Publication 1500-1 NIST. Big Data Interoperability Framework : Volume 1 , Definitions. National Institute of Standards and Technology, 1, 32. http://doi.org/10.6028/NIST.SP.1500-1 • Gartner. (2012). Analytic Ascendancy Model. Retrieved December 12, 2017, from http://www.growwithfarm.com/evolving-analytics-from-descriptive-to-prescriptive/ • Loury, J. (2014). Evolving Analytics: From Descriptive to Prescriptive. Retrieved December 11, 2017, from http://www.growwithfarm.com/evolving-analytics-from-descriptive-to-prescriptive/ • National Academi of Science. (2017). Overview of Data Science Methods. In Strengthening Data Science Methods for Department of Defense Personnel and Readiness Missions (pp. 53–79). The National Academies Press. http://doi.org/10.17226/23670 • Sivarajah, U. et al. (2017). Critical analysis of Big Data challenges and analytical methods. Journal of Business Research, 70, 263–286. http://doi.org/10.1016/J.JBUSRES.2016.08.001 • Larson, D., & Chang, V. (2016). International Journal of Information Management A review and future direction of agile , business intelligence , analytics and data science. International Journal of Information Management, 36(5), 700–710. http://doi.org/10.1016/j.ijinfomgt.2016.04.013 • https://www.networkworld.com/article/3325397/idc-expect-175-zettabytes-of-data-worldwide-by- 2025.html • Molina-Solana, M., Ros, M., Dolores Ruiz, M., Gomez-Romero, J., & Martin-Bautista, M. J. (2017). Data science for building energy management: A review. Renewable & Sustainable Energy Reviews, 70(December 2016), 598–609. http://doi.org/10.1016/j.rser.2016.11.132