SlideShare una empresa de Scribd logo
1 de 13
Descargar para leer sin conexión
Python para Data Science
Dra. Soledad Espezúa. Ll.
sespezua@pucp.edu.pe
Dr. Edwin Villanueva T.
evillatal@pucp.edu.pe
Ing. Daniel Saromo M.
daniel.saromo@pucp.pe
Sesión 1
Agenda
❑ Introducción a Data Science (DS)
• Definición de DS
• Diferencias entre ML, IA y DS
• Tareas en DS
• Metodología de DS
• Mercado laboral
❑ Python
❑ Ecosistema de herramientas en Python
3
4
Definición de Data Science
Programming skills Math & Statistic Knowledge
• La ciencia de datos es el campo de estudio que combina la experiencia en un dominio, las habilidades de programación y el
conocimiento de matemáticas y estadísticas para extraer información significativa de los datos. Los profesionales de la ciencia
de datos aplican algoritmos de aprendizaje automático a números, texto, imágenes, video, audio y más para producir sistemas
de inteligencia artificial (IA) que realizan tareas que normalmente requieren inteligencia humana. A su vez, estos sistemas
generan información que los analistas y los usuarios comerciales traducen en valor comercial tangible.
• La ciencia de datos es una colección de técnicas que se utilizan para extraer valor de los datos. Se ha convertido en una
herramienta esencial para cualquier organización que recopile, almacene y procese datos como parte de sus operaciones.
Las técnicas de ciencia de datos buscan encontrar patrones, conexiones y relaciones útiles dentro de los datos.
IA, Machine Learning y Data Science
5
Tareas en Data Science
6
Descripción &
exploración
• Visualización
Asociación de patrones
• Sist. generadores de
reglas
• Sis. de recomendación
Agrupamiento
•Clustering
Minimizar las distancias dentro de los grupos
Maximizar las distancias entre los grupos
Tareas en Data Science
7
Clasificación
•V. Categórica
Regresión o
Estimación
•V. Numérico
Pronóstico temporal
• V. Temporal
?
Variable
2
Variable 1
Función aproximada
Time series
Función aproximada
Forecasting
Metodología en Data Science
8
1) Fase de comprensión
del problema
2) Fase preparación
de los datos
7) Fase de implementación 3) Fase de análisis
exploratorio
6) Fase de evaluación
5) Fase de Modelado
4) Fase de configuración
9
Mercado Laboral
(Hal Varian, chief economist at Google and UC Berkeley professor)
Yahoo, Facebook, Google, Amazon, Microsoft, Walmart, eBay,
LinkedIn y Twitter, trabajan continuamente perfeccionado kit
de herramientas de desarrollo en DataScience
Data Science
Financial asessor
https://insights.stackoverflow.com/survey/2021
10
Python
• Python es un lenguaje de programación de alto nivel, interpretado,
orientado a objetos.
• De código abierto, para que cualquiera pueda contribuir a su
desarrollo.
• Es fácil de aprender
• Es fácil de usar para escribir software nuevo.
• Es fácil de obtener, instalar e implementar.
• Es un lenguaje flexible, que puede verse como un lenguaje
multiparadigma.
✓ Útil para las personas que ya saben programar en otros lenguajes
• Es un lenguaje de programación maduro
✓ También tiene excelentes propiedades para programadores novatos (ideal para
personas nunca han programado).
• Amplia disponibilidad de librerías para DS.
Aunque su nombre se asocie con la gran serpiente pitón,
el creador de Python(Guido Van Rossum , 1991) nombró
el lenguaje en honor de una vieja serie de comedia de la
BBC llamada Monty Python's Flying Circus.
¿Por qué usar Python?
11
https://insights.stackoverflow.com/trends?tags=java%2Cpython%2Cjavascript%2Cr
Crecimiento de los lenguajes mas populares
12
¿Por qué usar Python?
Comparación de los lenguajes más populares
https://trends.google.es/trends/explore?date=today%205-y&q=%2Fm%2F05z1_,%2Fm%2F07sbkfb,%2Fm%2F0212jm,%2Fm%2F053_x,%2Fm%2F0jgqg
https://storage.googleapis.com/kaggle-media/surveys/Kaggle's%20State%20of%20Machine%20Learning%20and%20Data%20Science%202021.pdf
13
Ecosistema de Herramientas en Python
❑ Ambiente de trabajo ❑ Librerías

Más contenido relacionado

Similar a Sesión 1.pdf

Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdfSesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdfJuan225106
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleoCICE
 
Transformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivelTransformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivelJOSE AHIAS LOPEZ PORTILLO
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningStratebi
 
diplomado-big-data-inteligencia-artificial.pdf
diplomado-big-data-inteligencia-artificial.pdfdiplomado-big-data-inteligencia-artificial.pdf
diplomado-big-data-inteligencia-artificial.pdfGunDoCordovaMezones1
 
RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntas
 RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntas RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntas
RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntasGAVIOTAZAVALLOS
 
El software en la actualidad
El software en la actualidadEl software en la actualidad
El software en la actualidadCristiBaqueReyes
 
Curso Superior BI Software Libre
Curso Superior BI Software LibreCurso Superior BI Software Libre
Curso Superior BI Software Libreanovacampus
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosOscar Corcho
 
Python - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de DatosPython - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de DatosRoman Herrera
 
fundamentos teoricos ingenieria de softwaare
fundamentos teoricos ingenieria de softwaarefundamentos teoricos ingenieria de softwaare
fundamentos teoricos ingenieria de softwaareLuz
 
Instituto de Inteligencia Artificial Aplicada Cursos 2024
Instituto de Inteligencia Artificial Aplicada Cursos 2024Instituto de Inteligencia Artificial Aplicada Cursos 2024
Instituto de Inteligencia Artificial Aplicada Cursos 2024Ramiro Aduviri Velasco
 
Taller de conocimiento fase 1
Taller de conocimiento fase 1Taller de conocimiento fase 1
Taller de conocimiento fase 1viviana50396
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptxRupertoCisneros3
 

Similar a Sesión 1.pdf (20)

Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdfSesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
Sesion-1-Carlos-Real-y-Antonio-Gazquez.pdf
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
 
Transformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivelTransformación Digital – Ciencia de datos el siguiente nivel
Transformación Digital – Ciencia de datos el siguiente nivel
 
Sitema de control de matricula
Sitema de control de matriculaSitema de control de matricula
Sitema de control de matricula
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine Learning
 
diplomado-big-data-inteligencia-artificial.pdf
diplomado-big-data-inteligencia-artificial.pdfdiplomado-big-data-inteligencia-artificial.pdf
diplomado-big-data-inteligencia-artificial.pdf
 
RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntas
 RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntas RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntas
RESUMEN DEL LIBRO KENDALL && KENDALL CAPITULO 1,2 Y 3.y las preguntas
 
El software en la actualidad
El software en la actualidadEl software en la actualidad
El software en la actualidad
 
Curso Superior BI Software Libre
Curso Superior BI Software LibreCurso Superior BI Software Libre
Curso Superior BI Software Libre
 
Herramientas Case
Herramientas CaseHerramientas Case
Herramientas Case
 
Trabajo de resumen de kendal
Trabajo de resumen de kendalTrabajo de resumen de kendal
Trabajo de resumen de kendal
 
Fi u5 a1_iv_rq_analisisdedatos
Fi u5 a1_iv_rq_analisisdedatosFi u5 a1_iv_rq_analisisdedatos
Fi u5 a1_iv_rq_analisisdedatos
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los Datos
 
Python - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de DatosPython - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de Datos
 
Matemática y Data Science
Matemática y Data ScienceMatemática y Data Science
Matemática y Data Science
 
fundamentos teoricos ingenieria de softwaare
fundamentos teoricos ingenieria de softwaarefundamentos teoricos ingenieria de softwaare
fundamentos teoricos ingenieria de softwaare
 
Instituto de Inteligencia Artificial Aplicada Cursos 2024
Instituto de Inteligencia Artificial Aplicada Cursos 2024Instituto de Inteligencia Artificial Aplicada Cursos 2024
Instituto de Inteligencia Artificial Aplicada Cursos 2024
 
Taller de conocimiento fase 1
Taller de conocimiento fase 1Taller de conocimiento fase 1
Taller de conocimiento fase 1
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx
 
1.uso_de_las_tic_3.pdf
1.uso_de_las_tic_3.pdf1.uso_de_las_tic_3.pdf
1.uso_de_las_tic_3.pdf
 

Último

Especificación casos de uso del negocio
Especificación  casos de uso del negocioEspecificación  casos de uso del negocio
Especificación casos de uso del negocioMagemyl Egana
 
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptxTECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptxUPSE
 
Tipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdfTipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdfCarlosSanchez452245
 
El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)Samuel Solís Fuentes
 
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptxCiberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptxcorreafrancoci00
 
Modelado de Casos de uso del negocio
Modelado de  Casos  de  uso  del negocioModelado de  Casos  de  uso  del negocio
Modelado de Casos de uso del negocioMagemyl Egana
 
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptxCIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptxalzabenjaminci00
 
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...juanforero141
 
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdfTECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdfUPSE
 

Último (9)

Especificación casos de uso del negocio
Especificación  casos de uso del negocioEspecificación  casos de uso del negocio
Especificación casos de uso del negocio
 
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptxTECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
TECNOLOGIA DE LA INFORMACION Y MULTIMEDIA 15 MAYO.pptx
 
Tipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdfTipos de datos en Microsoft Access definiciones.pdf
Tipos de datos en Microsoft Access definiciones.pdf
 
El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)El necesario mal del Legacy Code (Drupal Iberia 2024)
El necesario mal del Legacy Code (Drupal Iberia 2024)
 
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptxCiberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
Ciberseguridad y Seguridad Informática Franco Correa Grupo B.pptx
 
Modelado de Casos de uso del negocio
Modelado de  Casos  de  uso  del negocioModelado de  Casos  de  uso  del negocio
Modelado de Casos de uso del negocio
 
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptxCIBERSEGURIDAD  Y SEGURIDAD INFORMÁTICA.pptx
CIBERSEGURIDAD Y SEGURIDAD INFORMÁTICA.pptx
 
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
serenidad APP presentacion.pdfes una innovadora aplicación móvil diseñada par...
 
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdfTECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
TECNOLOGÍA DE LA INFORMACIÓN SLIDESHARE INVESTIGACION.pdf
 

Sesión 1.pdf

  • 1.
  • 2. Python para Data Science Dra. Soledad Espezúa. Ll. sespezua@pucp.edu.pe Dr. Edwin Villanueva T. evillatal@pucp.edu.pe Ing. Daniel Saromo M. daniel.saromo@pucp.pe Sesión 1
  • 3. Agenda ❑ Introducción a Data Science (DS) • Definición de DS • Diferencias entre ML, IA y DS • Tareas en DS • Metodología de DS • Mercado laboral ❑ Python ❑ Ecosistema de herramientas en Python 3
  • 4. 4 Definición de Data Science Programming skills Math & Statistic Knowledge • La ciencia de datos es el campo de estudio que combina la experiencia en un dominio, las habilidades de programación y el conocimiento de matemáticas y estadísticas para extraer información significativa de los datos. Los profesionales de la ciencia de datos aplican algoritmos de aprendizaje automático a números, texto, imágenes, video, audio y más para producir sistemas de inteligencia artificial (IA) que realizan tareas que normalmente requieren inteligencia humana. A su vez, estos sistemas generan información que los analistas y los usuarios comerciales traducen en valor comercial tangible. • La ciencia de datos es una colección de técnicas que se utilizan para extraer valor de los datos. Se ha convertido en una herramienta esencial para cualquier organización que recopile, almacene y procese datos como parte de sus operaciones. Las técnicas de ciencia de datos buscan encontrar patrones, conexiones y relaciones útiles dentro de los datos.
  • 5. IA, Machine Learning y Data Science 5
  • 6. Tareas en Data Science 6 Descripción & exploración • Visualización Asociación de patrones • Sist. generadores de reglas • Sis. de recomendación Agrupamiento •Clustering Minimizar las distancias dentro de los grupos Maximizar las distancias entre los grupos
  • 7. Tareas en Data Science 7 Clasificación •V. Categórica Regresión o Estimación •V. Numérico Pronóstico temporal • V. Temporal ? Variable 2 Variable 1 Función aproximada Time series Función aproximada Forecasting
  • 8. Metodología en Data Science 8 1) Fase de comprensión del problema 2) Fase preparación de los datos 7) Fase de implementación 3) Fase de análisis exploratorio 6) Fase de evaluación 5) Fase de Modelado 4) Fase de configuración
  • 9. 9 Mercado Laboral (Hal Varian, chief economist at Google and UC Berkeley professor) Yahoo, Facebook, Google, Amazon, Microsoft, Walmart, eBay, LinkedIn y Twitter, trabajan continuamente perfeccionado kit de herramientas de desarrollo en DataScience Data Science Financial asessor https://insights.stackoverflow.com/survey/2021
  • 10. 10 Python • Python es un lenguaje de programación de alto nivel, interpretado, orientado a objetos. • De código abierto, para que cualquiera pueda contribuir a su desarrollo. • Es fácil de aprender • Es fácil de usar para escribir software nuevo. • Es fácil de obtener, instalar e implementar. • Es un lenguaje flexible, que puede verse como un lenguaje multiparadigma. ✓ Útil para las personas que ya saben programar en otros lenguajes • Es un lenguaje de programación maduro ✓ También tiene excelentes propiedades para programadores novatos (ideal para personas nunca han programado). • Amplia disponibilidad de librerías para DS. Aunque su nombre se asocie con la gran serpiente pitón, el creador de Python(Guido Van Rossum , 1991) nombró el lenguaje en honor de una vieja serie de comedia de la BBC llamada Monty Python's Flying Circus.
  • 11. ¿Por qué usar Python? 11 https://insights.stackoverflow.com/trends?tags=java%2Cpython%2Cjavascript%2Cr Crecimiento de los lenguajes mas populares
  • 12. 12 ¿Por qué usar Python? Comparación de los lenguajes más populares https://trends.google.es/trends/explore?date=today%205-y&q=%2Fm%2F05z1_,%2Fm%2F07sbkfb,%2Fm%2F0212jm,%2Fm%2F053_x,%2Fm%2F0jgqg https://storage.googleapis.com/kaggle-media/surveys/Kaggle's%20State%20of%20Machine%20Learning%20and%20Data%20Science%202021.pdf
  • 13. 13 Ecosistema de Herramientas en Python ❑ Ambiente de trabajo ❑ Librerías