El documento describe las diferentes profesiones relacionadas con la ciencia de datos, incluyendo analistas de datos, ingenieros de datos, visualizadores de datos, gerentes de datos y científicos de datos. Explica que los analistas de datos se enfocan en convertir los datos en información e información en conocimientos mediante modelos descriptivos y diagnósticos. Los ingenieros de datos se encargan de construir y mantener la infraestructura de datos. Los visualizadores de datos comunican los hallazgos de una manera comprensible. Los gerentes de datos impulsan
2. Hay muchas cosas que hacemos
cuando hablamos de Ciencia de
Datos…
Pero lo importante es saber
porqué hacemos dichas cosas…
3. La Ciencia de Datos se trata de
comprender Sistemas Complejos
4.
5. Sin Método no hay Paraíso
La Ciencia de Datos no solo se relaciona con
conceptos como Big Data, Estadística, Análisis de
Datos, Minería de Datos, Machine Learning o
Visualización de Datos, sino que los trasciende y
solo puede existir gracias a quienes logran poner
todo esto en el viejo y buen Método Científico.
6. The Dark Scientist Rises
La explosión de los datos, junto a conocimientos
que parecen sacados de Ciencia Ficción y nuevas
herramientas potentes, permiten hacer frente a
importantes problemas sin resolver.
Debido a que esta ciencia será un factor clave
para empresas, sociedad y gobierno en los
próximos años, muchas personas quieren
convertirse en "Data Scientist".
7.
8. A Beautiful Mindset
En DataLab Community llamamos Data Scientists
no a quienes pueden procesar y analizar datos,
por muy complejas que sean sus estadísticas,
habilidades de programación o conjuntos de
datos, sino a quienes además sigan el Método
Científico y puedan generar ciencia con los
conocimientos y habilidades mencionados.
9. The Theory of Everyone
La Ciencia es la que realmente importa, pues
de este conjunto de conocimientos es que surgen
tanto mejores Data Scientists como mejores Data
Analysts, Data Engineers y Data Managers.
DataLab Community engloba e impulsa a todos
los Profesionales de la Ciencia de Datos.
10. El Análisis de Datos
“El objetivo es convertir los datos en información y la información
convertirla en insights”.
- Carly Fiorina
11. Data Analysts, Data Analysts Everywhere
La Filosofía de un analista de datos es la de Saber
Sus modelos son descriptivos y diagnósticos.
Su trabajo suele ser sistemático y en un ámbito
específico y bien delimitado, dando resultados
operacionales y tácticos.
Para un analista de datos, sus conjuntos de datos
ideales son coherentes y con un control sobre la
calidad y la certeza.
12. La Ingeniería de Datos
“Los datos son algo precioso y durarán incluso más que los
sistemas mismos”
- Tim Berners Lee
13. Big Data? There’s an engineer for that
Idealmente, evolución del Ingeniero de Software.
Debe poder hacer funcionar todo tipo de bases
de datos, relacionales y no relacionales.
Debe poder ser el amo y maestro de diversas
infraestructuras, incluyendo las distribuidas.
Debe entender los algoritmos y poder construir
algoritmos de alta eficiencia.
No debe temer a problemas complejos.
14. La Visualización de Datos
“El conocimiento es placentero, luego conlleva un disfrute estético,
y es bello lo que gusta por medio de la vista y el oído”.
- Aristóteles
15. But first, let me design a dashboard
El Visualizador de datos se asegura de que el
trabajo del equipo de Ciencia de Datos pueda ser
comprendido y valorado por el alto mando.
Tienen conocimientos en UI/UX.
No se trata de simples informes, debe permitir
que el usuario pueda “tocar” los insights.
Le agrega valor a la historia que el analista o
científico de datos quiere contar.
16. La Gestión de Datos
“Ha habido una sustitución de ideologías por hechos, datos
científicos e ingeniería de datos en esta administración”
- Vinton Cerf
17. Shut up and approve my project
El data manager impulsa la cultura de trabajo
del equipo de ciencia de datos.
Es el intermediario con la gestión organizacional.
Capaz de comprender qué direcciones puede
valer la pena intentar y cuáles son distracciones.
Debe ser bueno en relaciones y comunicación,
atendiendo peticiones y fuentes de datos.
Tiene que calcular y asegurar un buen ROI.
18. El Científico de Datos
“En los próximos 10 años, la ciencia de datos y el software harán
más por la medicina que todas las ciencias biológicas juntas”
- Vinod Khosla
19. I fucking love Science
Su filosofía es la de comprender
Sus modelos son predictivos y prescriptivos
Su trabajo suele ser experimental y ad-hoc, sus
resultados al ser estratégicos, generan valor.
Su conjunto de datos es diverso, y formado
flexiblemente, debiendo lidiar con la incerteza y
calidad variable de los datos.
Sigue el Método Científico
20. Yeah Mr. White! Yeah, Science!
Necesita hacer las preguntas adecuadas
Conocer estadística, matemática, algoritmia,
modelado predictivo y conocer el
trasfondotrasfondo.
Comunicar resultados, oral y visualmente
Curioso, va más allá de la superficie del problema
Paciente al integrar múltiples sistemas y datos
Conocer disciplinas como ML, NLP, Pruebas de
21. Bro, do you even science?
¿Hay evidencia suficiente para validar hipótesis?
¿Se ha evitado la parcialidad de los datos?
¿Se han evitado las variables de confusión?
¿Se ha mantenido la consistencia de los datos?
¿Se ha validado tu modelo predictivo?
¿Cuál es la precisión y cuál es la sensibilidad?
¿Tu modelo no está demasiado ajustado?
¿Experimento controlado, resultados repetibles?
¿Qué dicen los Peer-Reviews de tu Paper?