SlideShare una empresa de Scribd logo
1 de 17
Técnico en
Data Science
¿Qué es Data Science?
Data Science (o Ciencia de Datos) es como un área
multidisciplinar que, a través de diferentes campos
¿Es lo
mismo Data
Science y
Data
Analytics?
Data Science y Data Analytics son dos disciplinas
separadas por una línea muy delgada, lo que hace
que los términos se confundan y mezclen.
• Aunque comparten algunas áreas de formación,
metodologías de trabajo y otros conceptos, la
diferencia más destacable entre Data Science y
Data Analytics se basa en las funciones, roles y
tareas que desempeñan en el tratamiento de los
datos y en el nivel de especialización
• El Data Analytics tiene como propósito
principal extraer, procesar, agrupar y
analizar datos masivos de una fuente específica
y, a partir de ellos, generar informes con
soluciones para poder sacar conclusiones y
optimizar la toma de decisiones de negocio.
• Las y los profesionales Data Scientist predicen problemas del futuro, mientras que
su contraparte Data Analyst, resuelve problemas de negocio.
• En Data Science se convierten los datos en información y en Data Analytics se
convierten los datos en insights de negocio.
• En Data Science se recaba la información desde diferentes fuentes y en Data
Analytics desde una sola.
• En Data Science se investigan soluciones y se crean estrategias para lo que está
por venir y en Data Analytics se buscan soluciones a problemas ya detectados a
variables conocidas.
• Data Science requiere habilidades avanzadas en programación como Python, machine
learning y estadísticas, junto con la capacidad de trabajar con Big Data y
herramientas como TensorFlow. En contraste, en Data Analytics, es fundamental tener
habilidades en estadísticas, matemáticas y conocimiento de herramientas como Excel,
SQL y visualización de datos (por ejemplo, Power BI)
¿Entonces?
La ciencia de datos tiende a ser
más compleja, requiriendo
conocimientos avanzados y el
manejo de técnicas más
sofisticadas como el machine
learning y el procesamiento de
grandes volúmenes de datos.
El análisis de datos es
generalmente más descriptivo
y centrado en el presente, con
un enfoque en la generación de
informes y visualizaciones para
apoyar decisiones
empresariales.
La principal diferencia radica en el nivel de complejidad y el enfoque final del trabajo.
¿Qué herramientas debe utilizar?
¿Qué herramientas se enseñan en IPP?
Muchas empresas y organizaciones han adoptado Python para sus
procesos de ciencia de datos, lo que significa que hay un fuerte
impulso industrial detrás del desarrollo y mantenimiento de las
herramientas de Python.
En el campo de la ciencia de datos, Python es extremadamente
popular debido a su sintaxis clara y legible, su amplia gama de
bibliotecas y frameworks, y su comunidad activa que contribuye
constantemente con herramientas y soporte.
Librerías y Herramientas Especializadas: Python ofrece un
ecosistema rico y variado de bibliotecas y marcos de trabajo
diseñados específicamente para la ciencia de datos, como Pandas
para la manipulación de datos, NumPy para operaciones numéricas,
Matplotlib y Seaborn para visualización de datos.
SQL (lenguaje estructurado de consultas)
• SQL es un lenguaje de programación diseñado para la
gestión y manipulación de bases de datos relacionales. Es
ampliamente utilizado debido a su eficiencia y facilidad para
manejar grandes cantidades de datos. Para cualquier
profesional en ciencia de datos, conocer SQL es casi
indispensable, ya que es una herramienta estándar para
interactuar con bases de datos.
Tableau
• Es una poderosa herramienta de visualización de
datos y business intelligence (BI) que ayuda a
convertir datos en información comprensible. Es
ampliamente utilizado por empresas, científicos de
datos, analistas de datos, y otros profesionales
para crear visualizaciones de datos interactivas y
compartir insights
AWS
AWS es una plataforma de cloud computing que
proporciona poder de computación, almacenamiento de
base de datos, entrega de contenido y otras
funcionalidades para ayudar a las empresas a escalar y
crecer
Todas estas características pueden ser aprovechadas
para una variedad de tareas en la ciencia de datos,
desde el almacenamiento y procesamiento de datos
hasta el desarrollo y despliegue de modelos de
machine learning.
Apache Spark
• Apache Spark es un motor de procesamiento
distribuido que se utiliza para trabajar con grandes
conjuntos de datos de manera eficiente. Apache Spark
es un sistema de procesamiento de datos que toma
grandes volúmenes de datos de entrada, realiza
operaciones computacionales sobre esos datos y
luego entrega los resultados.
Scala
• Es un lenguaje de programación moderno, es una de
las principales lenguas utilizadas para escribir
aplicaciones en Apache Spark. Ofrece una sintaxis
concisa y capacidades funcionales que son muy
adecuadas para el procesamiento de datos.
Google: Utiliza la ciencia de datos en múltiples áreas, desde la
mejora de sus algoritmos de búsqueda y publicidad hasta el
desarrollo de productos como Google Maps y YouTube.
Amazon: Aplica la ciencia de datos en la personalización de
recomendaciones de productos, optimización de la logística,
análisis de tendencias de consumo, y en el desarrollo de
tecnologías como Alexa y sus servicios de cloud computing.
Facebook (Meta Platforms): Emplea la ciencia de datos para
personalizar feeds, dirigir publicidad, analizar tendencias de
usuarios, y mejorar la seguridad y privacidad en sus plataformas.
Netflix: Famosa por utilizar algoritmos de recomendación
basados en datos para personalizar la experiencia de
visualización de sus usuarios. También usa la ciencia de datos
para tomar decisiones sobre la producción de contenido original.
Uber: Dependiente de la ciencia de datos para optimizar rutas,
precios dinámicos, y en el desarrollo de tecnologías de
conducción autónoma.
¿Dónde se utiliza la ciencia de datos?
Otros rubros de aplicación
¿Por qué elegirla?
Demanda del Mercado: Data Science es
uno de los campos más demandados en
la tecnología actual. Las empresas buscan
constantemente profesionales capaces de
analizar y extraer valor de los datos.
Diversidad de Habilidades: Aprenderás
una variedad de habilidades, incluyendo
análisis estadístico, machine learning,
visualización de datos, y procesamiento
de grandes volúmenes de información.
Lenguajes de Programación y Bases de
Datos: Te familiarizarás con lenguajes
como Python y R, fundamentales en el
análisis de datos. Además, trabajarás con
bases de datos como SQL, y
herramientas de Big Data como Spark.
Campo Laboral Amplio: Puedes trabajar
en una variedad de industrias como
tecnología, finanzas, salud, marketing, y
más. Las empresas de todos los tamaños
necesitan expertos en datos.
¿Por qué elegirla?
Programas y Herramientas: Aprenderás
a utilizar herramientas avanzadas como
Jupyter Notebooks, Tableau, y
plataformas de cloud computing como
AWS y Azure para el análisis y
almacenamiento de datos.
Capacidades y Aplicaciones: Serás
capaz de realizar análisis predictivo,
modelado estadístico, y crear
visualizaciones de datos que informen
decisiones empresariales.
Áreas de Trabajo: Puedes
especializarte en áreas como
inteligencia de negocios, análisis de
datos, ingeniería de datos, o ciencia de
datos aplicada.
Potencial de Ingresos: El campo de
Data Science ofrece salarios
competitivos, reflejando la alta
demanda y la especialización
requerida.
skills al finalizar la carrera
Habilidades Técnicas
• Programación: Proficiencia en lenguajes de programación relevantes como Python,
esenciales para la manipulación de datos, análisis estadístico y machine learning.
• Análisis y Visualización de Datos: Capacidad para utilizar herramientas de análisis de
datos (como Pandas en Python) y plataformas de visualización (como Tableau, Matplotlib,
Seaborn) para interpretar y presentar datos de manera efectiva.
• Conocimientos de Estadística y Matemáticas: Entender métodos estadísticos,
probabilidades y matemáticas aplicadas para analizar e interpretar datos.
skills al finalizar la carrera
Habilidades Técnicas
• Machine Learning: Conocimientos en algoritmos de machine learning, tanto supervisados
como no supervisados, y su aplicación práctica.
• Manipulación de Grandes Volúmenes de Datos: Experiencia con herramientas de big
data como Apache Spark, Hadoop y conocimientos en SQL para la gestión de bases de
datos.
• Conocimiento de Herramientas Específicas: Familiaridad con plataformas de ciencia de
datos y herramientas de análisis como Jupyter Notebooks.
• Conocimientos en Tecnologías de Cloud Computing: Entender cómo utilizar y
aprovechar las plataformas de nube de AWS para el procesamiento y análisis de datos.
Muchas
gracias

Más contenido relacionado

Similar a capacitación Data science.pptx

A10 Analytics Desayuno Oct 2016
A10 Analytics Desayuno Oct 2016A10 Analytics Desayuno Oct 2016
A10 Analytics Desayuno Oct 2016Analytics10
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
 
Data Librarian ¿de qué va?
Data Librarian ¿de qué va?Data Librarian ¿de qué va?
Data Librarian ¿de qué va?Lourdes Feria
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningStratebi
 
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...Pepi Pedrero Rojo
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxLuis Beltran
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesStratebi
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Climanfef
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big DataDaniel Jiménez
 
saber crear y manipular conjunto de datos.pdf
saber crear y manipular conjunto de datos.pdfsaber crear y manipular conjunto de datos.pdf
saber crear y manipular conjunto de datos.pdfMariaJoseMay1
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayoANilez Solrak
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayoANilez Solrak
 

Similar a capacitación Data science.pptx (20)

A10 Analytics Desayuno Oct 2016
A10 Analytics Desayuno Oct 2016A10 Analytics Desayuno Oct 2016
A10 Analytics Desayuno Oct 2016
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Curso Base Datos
Curso Base DatosCurso Base Datos
Curso Base Datos
 
Data Librarian ¿de qué va?
Data Librarian ¿de qué va?Data Librarian ¿de qué va?
Data Librarian ¿de qué va?
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Cursos de Big Data y Machine Learning
Cursos de Big Data y Machine LearningCursos de Big Data y Machine Learning
Cursos de Big Data y Machine Learning
 
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptx
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
saber crear y manipular conjunto de datos.pdf
saber crear y manipular conjunto de datos.pdfsaber crear y manipular conjunto de datos.pdf
saber crear y manipular conjunto de datos.pdf
 
Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayo
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayo
 

Último

Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfedsonzav8
 
Condensadores de la rama de electricidad y magnetismo
Condensadores de la rama de electricidad y magnetismoCondensadores de la rama de electricidad y magnetismo
Condensadores de la rama de electricidad y magnetismosaultorressep
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptMarianoSanchez70
 
nom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdfnom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdfDiegoMadrigal21
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxClaudiaPerez86192
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdfCristhianZetaNima
 
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)ssuser563c56
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxEduardoSnchezHernnde5
 
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVEl proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVSebastianPaez47
 
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.pptoscarvielma45
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacajeremiasnifla
 
Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaAlexanderimanolLencr
 
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptxguillermosantana15
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfKEVINYOICIAQUINOSORI
 
Clase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptxClase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptxChristopherOlave2
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMarceloQuisbert6
 
Obras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónObras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónXimenaFallaLecca1
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfyoseka196
 
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASTEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASfranzEmersonMAMANIOC
 

Último (20)

Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdf
 
Condensadores de la rama de electricidad y magnetismo
Condensadores de la rama de electricidad y magnetismoCondensadores de la rama de electricidad y magnetismo
Condensadores de la rama de electricidad y magnetismo
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
 
nom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdfnom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdf
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptx
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
 
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptx
 
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVEl proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
 
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpaca
 
Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiología
 
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
 
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdfVALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdf
 
Clase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptxClase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptx
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principios
 
Obras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónObras paralizadas en el sector construcción
Obras paralizadas en el sector construcción
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdf
 
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASTEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
 

capacitación Data science.pptx

  • 2. ¿Qué es Data Science? Data Science (o Ciencia de Datos) es como un área multidisciplinar que, a través de diferentes campos
  • 3. ¿Es lo mismo Data Science y Data Analytics? Data Science y Data Analytics son dos disciplinas separadas por una línea muy delgada, lo que hace que los términos se confundan y mezclen. • Aunque comparten algunas áreas de formación, metodologías de trabajo y otros conceptos, la diferencia más destacable entre Data Science y Data Analytics se basa en las funciones, roles y tareas que desempeñan en el tratamiento de los datos y en el nivel de especialización • El Data Analytics tiene como propósito principal extraer, procesar, agrupar y analizar datos masivos de una fuente específica y, a partir de ellos, generar informes con soluciones para poder sacar conclusiones y optimizar la toma de decisiones de negocio.
  • 4. • Las y los profesionales Data Scientist predicen problemas del futuro, mientras que su contraparte Data Analyst, resuelve problemas de negocio. • En Data Science se convierten los datos en información y en Data Analytics se convierten los datos en insights de negocio. • En Data Science se recaba la información desde diferentes fuentes y en Data Analytics desde una sola. • En Data Science se investigan soluciones y se crean estrategias para lo que está por venir y en Data Analytics se buscan soluciones a problemas ya detectados a variables conocidas. • Data Science requiere habilidades avanzadas en programación como Python, machine learning y estadísticas, junto con la capacidad de trabajar con Big Data y herramientas como TensorFlow. En contraste, en Data Analytics, es fundamental tener habilidades en estadísticas, matemáticas y conocimiento de herramientas como Excel, SQL y visualización de datos (por ejemplo, Power BI)
  • 5. ¿Entonces? La ciencia de datos tiende a ser más compleja, requiriendo conocimientos avanzados y el manejo de técnicas más sofisticadas como el machine learning y el procesamiento de grandes volúmenes de datos. El análisis de datos es generalmente más descriptivo y centrado en el presente, con un enfoque en la generación de informes y visualizaciones para apoyar decisiones empresariales. La principal diferencia radica en el nivel de complejidad y el enfoque final del trabajo.
  • 7. ¿Qué herramientas se enseñan en IPP? Muchas empresas y organizaciones han adoptado Python para sus procesos de ciencia de datos, lo que significa que hay un fuerte impulso industrial detrás del desarrollo y mantenimiento de las herramientas de Python. En el campo de la ciencia de datos, Python es extremadamente popular debido a su sintaxis clara y legible, su amplia gama de bibliotecas y frameworks, y su comunidad activa que contribuye constantemente con herramientas y soporte. Librerías y Herramientas Especializadas: Python ofrece un ecosistema rico y variado de bibliotecas y marcos de trabajo diseñados específicamente para la ciencia de datos, como Pandas para la manipulación de datos, NumPy para operaciones numéricas, Matplotlib y Seaborn para visualización de datos.
  • 8. SQL (lenguaje estructurado de consultas) • SQL es un lenguaje de programación diseñado para la gestión y manipulación de bases de datos relacionales. Es ampliamente utilizado debido a su eficiencia y facilidad para manejar grandes cantidades de datos. Para cualquier profesional en ciencia de datos, conocer SQL es casi indispensable, ya que es una herramienta estándar para interactuar con bases de datos. Tableau • Es una poderosa herramienta de visualización de datos y business intelligence (BI) que ayuda a convertir datos en información comprensible. Es ampliamente utilizado por empresas, científicos de datos, analistas de datos, y otros profesionales para crear visualizaciones de datos interactivas y compartir insights
  • 9. AWS AWS es una plataforma de cloud computing que proporciona poder de computación, almacenamiento de base de datos, entrega de contenido y otras funcionalidades para ayudar a las empresas a escalar y crecer Todas estas características pueden ser aprovechadas para una variedad de tareas en la ciencia de datos, desde el almacenamiento y procesamiento de datos hasta el desarrollo y despliegue de modelos de machine learning.
  • 10. Apache Spark • Apache Spark es un motor de procesamiento distribuido que se utiliza para trabajar con grandes conjuntos de datos de manera eficiente. Apache Spark es un sistema de procesamiento de datos que toma grandes volúmenes de datos de entrada, realiza operaciones computacionales sobre esos datos y luego entrega los resultados. Scala • Es un lenguaje de programación moderno, es una de las principales lenguas utilizadas para escribir aplicaciones en Apache Spark. Ofrece una sintaxis concisa y capacidades funcionales que son muy adecuadas para el procesamiento de datos.
  • 11. Google: Utiliza la ciencia de datos en múltiples áreas, desde la mejora de sus algoritmos de búsqueda y publicidad hasta el desarrollo de productos como Google Maps y YouTube. Amazon: Aplica la ciencia de datos en la personalización de recomendaciones de productos, optimización de la logística, análisis de tendencias de consumo, y en el desarrollo de tecnologías como Alexa y sus servicios de cloud computing. Facebook (Meta Platforms): Emplea la ciencia de datos para personalizar feeds, dirigir publicidad, analizar tendencias de usuarios, y mejorar la seguridad y privacidad en sus plataformas. Netflix: Famosa por utilizar algoritmos de recomendación basados en datos para personalizar la experiencia de visualización de sus usuarios. También usa la ciencia de datos para tomar decisiones sobre la producción de contenido original. Uber: Dependiente de la ciencia de datos para optimizar rutas, precios dinámicos, y en el desarrollo de tecnologías de conducción autónoma. ¿Dónde se utiliza la ciencia de datos?
  • 12. Otros rubros de aplicación
  • 13. ¿Por qué elegirla? Demanda del Mercado: Data Science es uno de los campos más demandados en la tecnología actual. Las empresas buscan constantemente profesionales capaces de analizar y extraer valor de los datos. Diversidad de Habilidades: Aprenderás una variedad de habilidades, incluyendo análisis estadístico, machine learning, visualización de datos, y procesamiento de grandes volúmenes de información. Lenguajes de Programación y Bases de Datos: Te familiarizarás con lenguajes como Python y R, fundamentales en el análisis de datos. Además, trabajarás con bases de datos como SQL, y herramientas de Big Data como Spark. Campo Laboral Amplio: Puedes trabajar en una variedad de industrias como tecnología, finanzas, salud, marketing, y más. Las empresas de todos los tamaños necesitan expertos en datos.
  • 14. ¿Por qué elegirla? Programas y Herramientas: Aprenderás a utilizar herramientas avanzadas como Jupyter Notebooks, Tableau, y plataformas de cloud computing como AWS y Azure para el análisis y almacenamiento de datos. Capacidades y Aplicaciones: Serás capaz de realizar análisis predictivo, modelado estadístico, y crear visualizaciones de datos que informen decisiones empresariales. Áreas de Trabajo: Puedes especializarte en áreas como inteligencia de negocios, análisis de datos, ingeniería de datos, o ciencia de datos aplicada. Potencial de Ingresos: El campo de Data Science ofrece salarios competitivos, reflejando la alta demanda y la especialización requerida.
  • 15. skills al finalizar la carrera Habilidades Técnicas • Programación: Proficiencia en lenguajes de programación relevantes como Python, esenciales para la manipulación de datos, análisis estadístico y machine learning. • Análisis y Visualización de Datos: Capacidad para utilizar herramientas de análisis de datos (como Pandas en Python) y plataformas de visualización (como Tableau, Matplotlib, Seaborn) para interpretar y presentar datos de manera efectiva. • Conocimientos de Estadística y Matemáticas: Entender métodos estadísticos, probabilidades y matemáticas aplicadas para analizar e interpretar datos.
  • 16. skills al finalizar la carrera Habilidades Técnicas • Machine Learning: Conocimientos en algoritmos de machine learning, tanto supervisados como no supervisados, y su aplicación práctica. • Manipulación de Grandes Volúmenes de Datos: Experiencia con herramientas de big data como Apache Spark, Hadoop y conocimientos en SQL para la gestión de bases de datos. • Conocimiento de Herramientas Específicas: Familiaridad con plataformas de ciencia de datos y herramientas de análisis como Jupyter Notebooks. • Conocimientos en Tecnologías de Cloud Computing: Entender cómo utilizar y aprovechar las plataformas de nube de AWS para el procesamiento y análisis de datos.