3. ¿QUÉ ES EL DATA SCIENCE?
El Data Science (o Ciencia de Datos), es una
disciplina dentro del mundo de la ciencia y la
informática la cual engloba gran variedad de
subcampos, por la tanto para dar una definición
clara de lo que es la ciencia de datos, hay que
tener en cuenta lo siguiente:
1. Involucra grandes conocimientos en los
campos de las matemáticas y la estadística.
2. Utiliza métodos científicos.
3. Tiene en cuenta aspectos computacionales.
4. Incluye el aprendizaje automatizado, la
inteligencia artificial, …
Todo esto entre muchas otras cosas. Ahora, con
esto en mente podemos pasar a dar una definición
más objetiva sobre el significado de este término.
4. DEFINICIÓN
Teniendo en cuenta todo lo visto anteriormente la ciencia de datos se puede definir como un campo
interdisciplinario que involucra métodos científicos, diversidad de formas para extraer el conocimiento
y la información, y un mejor entendimiento de los datos, conteniendo así diferentes campos como
son la estadística, el aprendizaje de datos, la analítica preventiva o la minería de datos (de la cual
hablaremos a continuación).
5. MINERÍA DE DATOS
La minería de datos es una parte muy grande
de la ciencia de datos; incluye todo lo
relacionado con sacar información útil y de
valor de cualquier fuente. Usualmente parte de
datos no estructurados (Textos humanos,
etc…) y termina en unas conclusiones o
información de valor utilizando ciertas técnicas
y algoritmos.
Un problema de minería de datos se compone
de las siguientes partes:
1. Recogida de la información
2. Preprocesado;(reducción de
dimensionalidad, normalización, ...)
3. Entrenamiento del modelo
4. Testeo
5. Visualización e interpretación del
resultado
6. BIG DATA
No hay que confundir este término con la
ciencia de datos, que si bien están
relacionados, no significan lo mismo.
Big data es la disciplina que trabaja con
grandes cantidades de datos. Es decir, el big
data está presente en los proyectos más
complejos de la ciencia de datos.
Al igual que se tiene big data, también existe
el small data (excel o base de datos
pequeña) y medium data (técnicas para
procesar la información porque sería
demasiado almacenarla toda de golpe),
aunque no son utilizados de igual manera
que el primero.
7. HISTORIA
• Es considerada una disciplina de reciente creación, aunque ya en la década de los 60 se
comenzó a emplear el término ciencia de datos como sustituto de las ciencias
computacionales.
• En 1977 fue creado el IASC (International Association for Statistical Computing ) para
“convertir datos en información y conocimiento“.
• En 2001 William Cleveland la introdujo como disciplina independiente y estableció las 6
áreas que conforman este campo: investigaciones multidisciplinarias, modelos y métodos
para datos, computación con datos, pedagogía, evaluación de herramientas, y teoría.
8. • En 2002 el CODATA empezó la publicación del
Data Science Journal, y poco después la
Universidad de Columbia empezó a publicar
The Journal of Data Science.
• En 2014 fue lanzada la primera conferencia
internacional de ciencia de datos desde el
IEEE en Nueva Jersey, y a su vez fue fundado
el Data Science Institute en Londres
Data Sciences Center, Universidad de
Boston
9. Hoy en día la ciencia de datos se ha extendido a gran escala y cada día
aumenta su demanda y la variedad de sus aplicaciones.
En la conocida como Era de los Datos, esta disciplina tiene ahora mas
relevancia que nunca a la hora de analizar datos y convertirlos en
información.
Es la tercera profesión más demandada en
España, por lo que los científicos de datos están
muy solicitados actualmente.
10. Existen grados en Ciencia y Análisis de datos en diversas universidades
españolas, al igual que en el resto del mundo, y másteres en los que
especializarse en este campo con cada vez más demanda.
España ya es el octavo país por número de profesionales en esta especialidad
y se podría considerar una de las potencias mundiales en términos de ciencia
de datos.
José A. Guerrero, mejor científico
de datos del mundo según el
Kaggle (plataforma global que
agrupa a 130.000 científicos de
datos)
12. ¿En qué empresas trabajan los científicos de
datos?
● Asesorías financieras: IBM Analytics, Deloitte…
○ Análisis de datos financieros
● Empresas de software: Google, Facebook, Spotify…
○ Machine Learning
○ Creación de perfiles de consumo
● Agencias publicitarias:
○ Uso (o creación) de perfiles de consumo
13. Otras aplicaciones:
• Políticas públicas gubernamentales:
• El BID (Banco Interamericano de Desarrollo) ha propuesto el uso de la ciencia de
datos para implementar y diseñar políticas públicas :
• Movilidad urbana sostenible
• Ciudades inteligentes
• Seguridad
• Propiedad de datos
• Privacidad
18. BIBLIOGRAFÍA
Aquí os dejamos algunas de las páginas de donde hemos recopilado información:
-https://sg.com.mx/revista/43/definiendo-ciencia-datos
-https://aukera.es/data-science-que-es-y-que-no-es/
-https://docs.microsoft.com/es-es/sql/analysis-services/data-mining/data-mining-concepts?view=sql-
server-2017
-https://www.sinnexus.com/business_intelligence/datamining.aspx
- Elpais.com
-Xataka.com
-Europapress.com