capacitación Data science.pptx

¿Qué es Data Science?
Data Science (o Ciencia de Datos) es como un área
multidisciplinar que, a través de diferentes campos

¿Es lo
mismo Data
Science y
Data
Analytics?
Data Science y Data Analytics son dos disciplinas
separadas por una línea muy delgada, lo que hace
que los términos se confundan y mezclen.
• Aunque comparten algunas áreas de formación,
metodologías de trabajo y otros conceptos, la
diferencia más destacable entre Data Science y
Data Analytics se basa en las funciones, roles y
tareas que desempeñan en el tratamiento de los
datos y en el nivel de especialización
• El Data Analytics tiene como propósito
principal extraer, procesar, agrupar y
analizar datos masivos de una fuente específica
y, a partir de ellos, generar informes con
soluciones para poder sacar conclusiones y
optimizar la toma de decisiones de negocio.

• Las y los profesionales Data Scientist predicen problemas del futuro, mientras que
su contraparte Data Analyst, resuelve problemas de negocio.
• En Data Science se convierten los datos en información y en Data Analytics se
convierten los datos en insights de negocio.
• En Data Science se recaba la información desde diferentes fuentes y en Data
Analytics desde una sola.
• En Data Science se investigan soluciones y se crean estrategias para lo que está
por venir y en Data Analytics se buscan soluciones a problemas ya detectados a
variables conocidas.
• Data Science requiere habilidades avanzadas en programación como Python, machine
learning y estadísticas, junto con la capacidad de trabajar con Big Data y
herramientas como TensorFlow. En contraste, en Data Analytics, es fundamental tener
habilidades en estadísticas, matemáticas y conocimiento de herramientas como Excel,
SQL y visualización de datos (por ejemplo, Power BI)

¿Entonces?
La ciencia de datos tiende a ser
más compleja, requiriendo
conocimientos avanzados y el
manejo de técnicas más
sofisticadas como el machine
learning y el procesamiento de
grandes volúmenes de datos.
El análisis de datos es
generalmente más descriptivo
y centrado en el presente, con
un enfoque en la generación de
informes y visualizaciones para
apoyar decisiones
empresariales.
La principal diferencia radica en el nivel de complejidad y el enfoque final del trabajo.

¿Qué herramientas debe utilizar?

¿Qué herramientas se enseñan en IPP?
Muchas empresas y organizaciones han adoptado Python para sus
procesos de ciencia de datos, lo que significa que hay un fuerte
impulso industrial detrás del desarrollo y mantenimiento de las
herramientas de Python.
En el campo de la ciencia de datos, Python es extremadamente
popular debido a su sintaxis clara y legible, su amplia gama de
bibliotecas y frameworks, y su comunidad activa que contribuye
constantemente con herramientas y soporte.
Librerías y Herramientas Especializadas: Python ofrece un
ecosistema rico y variado de bibliotecas y marcos de trabajo
diseñados específicamente para la ciencia de datos, como Pandas
para la manipulación de datos, NumPy para operaciones numéricas,
Matplotlib y Seaborn para visualización de datos.

SQL (lenguaje estructurado de consultas)
• SQL es un lenguaje de programación diseñado para la
gestión y manipulación de bases de datos relacionales. Es
ampliamente utilizado debido a su eficiencia y facilidad para
manejar grandes cantidades de datos. Para cualquier
profesional en ciencia de datos, conocer SQL es casi
indispensable, ya que es una herramienta estándar para
interactuar con bases de datos.
Tableau
• Es una poderosa herramienta de visualización de
datos y business intelligence (BI) que ayuda a
convertir datos en información comprensible. Es
ampliamente utilizado por empresas, científicos de
datos, analistas de datos, y otros profesionales
para crear visualizaciones de datos interactivas y
compartir insights

AWS
AWS es una plataforma de cloud computing que
proporciona poder de computación, almacenamiento de
base de datos, entrega de contenido y otras
funcionalidades para ayudar a las empresas a escalar y
crecer
Todas estas características pueden ser aprovechadas
para una variedad de tareas en la ciencia de datos,
desde el almacenamiento y procesamiento de datos
hasta el desarrollo y despliegue de modelos de
machine learning.

Apache Spark
• Apache Spark es un motor de procesamiento
distribuido que se utiliza para trabajar con grandes
conjuntos de datos de manera eficiente. Apache Spark
es un sistema de procesamiento de datos que toma
grandes volúmenes de datos de entrada, realiza
operaciones computacionales sobre esos datos y
luego entrega los resultados.
Scala
• Es un lenguaje de programación moderno, es una de
las principales lenguas utilizadas para escribir
aplicaciones en Apache Spark. Ofrece una sintaxis
concisa y capacidades funcionales que son muy
adecuadas para el procesamiento de datos.

Google: Utiliza la ciencia de datos en múltiples áreas, desde la
mejora de sus algoritmos de búsqueda y publicidad hasta el
desarrollo de productos como Google Maps y YouTube.
Amazon: Aplica la ciencia de datos en la personalización de
recomendaciones de productos, optimización de la logística,
análisis de tendencias de consumo, y en el desarrollo de
tecnologías como Alexa y sus servicios de cloud computing.
Facebook (Meta Platforms): Emplea la ciencia de datos para
personalizar feeds, dirigir publicidad, analizar tendencias de
usuarios, y mejorar la seguridad y privacidad en sus plataformas.
Netflix: Famosa por utilizar algoritmos de recomendación
basados en datos para personalizar la experiencia de
visualización de sus usuarios. También usa la ciencia de datos
para tomar decisiones sobre la producción de contenido original.
Uber: Dependiente de la ciencia de datos para optimizar rutas,
precios dinámicos, y en el desarrollo de tecnologías de
conducción autónoma.
¿Dónde se utiliza la ciencia de datos?

¿Por qué elegirla?
Demanda del Mercado: Data Science es
uno de los campos más demandados en
la tecnología actual. Las empresas buscan
constantemente profesionales capaces de
analizar y extraer valor de los datos.
Diversidad de Habilidades: Aprenderás
una variedad de habilidades, incluyendo
análisis estadístico, machine learning,
visualización de datos, y procesamiento
de grandes volúmenes de información.
Lenguajes de Programación y Bases de
Datos: Te familiarizarás con lenguajes
como Python y R, fundamentales en el
análisis de datos. Además, trabajarás con
bases de datos como SQL, y
herramientas de Big Data como Spark.
Campo Laboral Amplio: Puedes trabajar
en una variedad de industrias como
tecnología, finanzas, salud, marketing, y
más. Las empresas de todos los tamaños
necesitan expertos en datos.

¿Por qué elegirla?
Programas y Herramientas: Aprenderás
a utilizar herramientas avanzadas como
Jupyter Notebooks, Tableau, y
plataformas de cloud computing como
AWS y Azure para el análisis y
almacenamiento de datos.
Capacidades y Aplicaciones: Serás
capaz de realizar análisis predictivo,
modelado estadístico, y crear
visualizaciones de datos que informen
decisiones empresariales.
Áreas de Trabajo: Puedes
especializarte en áreas como
inteligencia de negocios, análisis de
datos, ingeniería de datos, o ciencia de
datos aplicada.
Potencial de Ingresos: El campo de
Data Science ofrece salarios
competitivos, reflejando la alta
demanda y la especialización
requerida.

skills al finalizar la carrera
Habilidades Técnicas
• Programación: Proficiencia en lenguajes de programación relevantes como Python,
esenciales para la manipulación de datos, análisis estadístico y machine learning.
• Análisis y Visualización de Datos: Capacidad para utilizar herramientas de análisis de
datos (como Pandas en Python) y plataformas de visualización (como Tableau, Matplotlib,
Seaborn) para interpretar y presentar datos de manera efectiva.
• Conocimientos de Estadística y Matemáticas: Entender métodos estadísticos,
probabilidades y matemáticas aplicadas para analizar e interpretar datos.

skills al finalizar la carrera
Habilidades Técnicas
• Machine Learning: Conocimientos en algoritmos de machine learning, tanto supervisados
como no supervisados, y su aplicación práctica.
• Manipulación de Grandes Volúmenes de Datos: Experiencia con herramientas de big
data como Apache Spark, Hadoop y conocimientos en SQL para la gestión de bases de
datos.
• Conocimiento de Herramientas Específicas: Familiaridad con plataformas de ciencia de
datos y herramientas de análisis como Jupyter Notebooks.
• Conocimientos en Tecnologías de Cloud Computing: Entender cómo utilizar y
aprovechar las plataformas de nube de AWS para el procesamiento y análisis de datos.

capacitación Data science.pptx

Recomendados

Recomendados

Más contenido relacionado

Similar a capacitación Data science.pptx

Similar a capacitación Data science.pptx (20)

Último

Último (20)

capacitación Data science.pptx