SlideShare una empresa de Scribd logo
1 de 38
Descargar para leer sin conexión
CURSO DE INTEGRACIÓN A LA VIDA UNIVERSITARIA
Curso propedéutico para el aprendizaje autogestivo en un
ambiente virtual 2019-2
Unidad 3. Gestión de información para la investigación
Informe final
Data Science: correlación curricular
Nombre del aspirante: ​Rodrigo Gabino Ramírez Moreno
División y/o Aula:
División de Ciencias Exactas, Ingenierías y Tecnologías (CEIT)
Grupo: ​Gp 044
Nombre del monitor(a): ​Noemí Navarrete Aguirre
Dirección del blog:​ ​https://jadwer.wordpress.com/
Fecha: 29 de mayo de 2019
1
INTRODUCCIÓN 4
Justificación 4
Objetivo general 4
Objetivos específicos 4
METODOLOGÍA 5
Plan de trabajo 5
Investigación de documental 5
Investigación de campo 5
Bitácora de investigación 5
Entrevista 6
Encuesta 6
MARCO TEÓRICO 8
Científico de datos 8
Definición 9
Ciclo de vida 9
Bases curriculares 10
RESULTADOS 15
La entrevista 15
La encuesta 17
Descripción de la muestra 17
Datos demográficos 17
Percepción y necesidad de la ciencia de datos 20
CONCLUSIONES Y RECOMENDACIONES 27
REFERENCIAS 28
ANEXOS 30
Bitácora de investigación 30
La entrevista 33
La encuesta 33
2
Demográficos 33
La ciencia de datos 35
3
INTRODUCCIÓN
La cantidad de información que se tiene actualmente acerca de cualquier tema obliga de
manera imperante a tener estrategias, metodologías y herramientas que nos permitan
ordenar, categorizar y obtener un valor de los datos que se tienen. Para éste propósito
existen temas muy puntuales que se categorizan dentro de la ciencia de datos.
Justificación
Adentrarse en la ciencia de datos es una tarea ardua debido a la magnitud de la aplicación y
a los límites casi borrosos que se tiene entre algunas áreas del conocimiento donde se
aplica. Por lo anterior, es importante tener un compendio breve pero informado de los temas
que se relacionan con la ciencia de datos y por qué es necesario para su uso.
Objetivo general
Crear un panorama relacional de las áreas del conocimiento que se relacionan con la
ciencia de datos, además de definir qué son, para qué sirven y de qué manera se utilizan en
el ciclo de vida del tratamiento de los datos.
Objetivos específicos
● Recopilar la información de los temas que dan lugar a la ciencia de datos
● Cuál es el ciclo de vida de la ciencia de datos
● Qué herramientas existen y en qué casos se aplican
● Cómo se relacionan las ciencias de la computación / TI
● Temas necesarios de Matemáticas y estadística
● Conocimientos en negocios y finanzas
4
METODOLOGÍA
La metodología utilizada en el presente trabajo se describe a continuación.
Plan de trabajo
El plan de trabajo se dividió en la definición del problema y objetivos general y particulares.
Así como la calendarización de la investigación documental y de campo, para concluir con
la elaboración del presente trabajo y la presentación de los resultados.
Investigación de documental
Para realizar ésta investigación, se llevó a cabo una búsqueda documental de los términos,
definiciones y aplicaciones de la ciencia de datos. La herramienta principal para la
búsqueda de información fue google académico, sin embargo, se encontró información
valiosa en buscadores como Scielo, Alicia, Youtube y Wikipedia, no como fuente sino como
proveedor de referencias acerca del tema.
Investigación de campo
Bitácora de investigación
17 de mayo de 2019
Se realizó una visita a Centrum Transgenia, una empresa dedicada a la innovación
tecnológica a través de la Industria 4.0. Es una empresa que usa la ciencia de datos para
las empresas.
5
Entrevista
Entrevista realizada al Dr. Julian Valencia Nava, científico de datos de Centrum Transgenia.
Encuesta
Dirigida a profesionistas y universitarios con el fin de identificar la relación de la ciencia de datos con 
las diferentes áreas de conocimiento. Los datos fueron analizados usando la aplicación de IBM Stata.
6
7
MARCO TEÓRICO
El motivo de la presente investigación es la de recopilar el contexto curricular
necesario para establecer las relaciones dentro del ámbito de la ciencia de datos,
para ello definiremos la ciencia de datos, las bases curriculares y el contexto social
necesario para ser un científico de datos.
Científico de datos
La cantidad de datos que se manejan actualmente, gracias a las tecnologías y
conexión ubicua existente hacen poco manejables los datos crudos y mal
estructurados, de ahí surge la necesidad de tener personas especializadas en el
manejo correcto de toda esa información. La evolución que se ha presentado a
través de las necesidades de las empresas dan creación a puestos específicos.
(Edureka, 2018).
● Analista de datos: Toma los datos y los usan para ayudar a las empresas a
tomar mejores decisiones de negocio. El proceso básico que siguen es:
○ Recolección de datos
○ Análisis de los datos
○ Creación de reportes
● Ingeniero de datos: Son los que desarrollan, construyen, prueban y
mantienen la arquitectura completa del SISTEMA DE PROCESAMIENTO
A GRAN ESCALA a través de la configuración de tuberías de datos.
● Científico de datos: Es un profesional que trata con enormes cantidades de
datos estructurados/no-estructurados y usa sus habilidades en
matemáticas, estadística, programación, machine learning, etc. Para
presentar la visualización del estado de los datos analizados para la toma
de decisiones de negocios.
8
O dicho de una manera más sencilla, un científico de datos es la persona con las
habilidades de minar los datos no estructurados, de desarrollar algoritmos de
análisis, implementar modelos y métodos de proyección y aprendizaje automatizado
y desplegar un resultado eficiente para la toma de decisiones. (Science, 2019).
Definición
La ciencia de datos es un campo interdisciplinario que involucra métodos científicos,
procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos
en sus diferentes formas, ya sea estructurados o no estructurados lo cual es una
continuación de algunos campos de análisis de datos como la estadística, la minería
de datos, el aprendizaje automático y la analítica predictiva. (Liu, 2015)
Ciclo de vida
Comprensión de la necesidad. O entendimiento del negocio, realiza las preguntas
relevantes y define objetivos para el problema que se necesita resolver.
9
Minería de datos. ​Busca y obtiene los datos necesarios para el proyecto
Limpieza de los datos. ​Arregla las inconsistencias con los datos y maneja los valores
perdidos.
Exploración de los datos. ​Se crean las hipótesis de la definición del problema por el
análisis visual de los datos.
Ingeniería de características. ​Busca las características importantes y construye algunos
significados a través de los datos crudos que se tienen.
Modelado predictivo - simulación. ​Entrenamiento del aprendizaje automático a través de
Machine Learning, evalúa su rendimiento y lo usa para crear predicciones.
Visualización de los datos. ​Comunicar los resultados a las partes interesadas clave a
través de gráficas y visualizaciones interactivas
Bases curriculares
Con base en el programa del MIT (MIT, 2019), se obtiene el plan de estudios
mostrado en la Tabla 1:
Tabla 1: Plan de estudios del Instituto Tecnológico de Massachusetts (MIT)
Required Subjects Units
Mathematics
18.06 Linear Algebra 12
Computation/Algorithms
6.0001
Introduction to Computer Science Programming in
Python
6
6.009 Fundamentals of Programming 1 12
6.006 Introduction to Algorithms 12
6.042[J] Mathematics for Computer Science 12
6.046[J] Design and Analysis of Algorithms 12
Economics
10
14.01 Principles of Microeconomics 2 12
14.32 Econometric Data Science 12
Introductory Probability and Statistics
Select one of the following: 12
6.041A
& ​6.041B
Introduction to Probability I
and Introduction to Probability II
14.30 Introduction to Statistical Methods in Economics
18.600 Probability and Random Variables
Data Science
6.036 Introduction to Machine Learning 12
Project-based
6.UAT Oral Communication (CI-M) 3 9-12
or
15.276
Communicating with Data
Select one of the following: 12
14.05 Intermediate Macroeconomics (CI-M) 4
14.18 Mathematical Economic Modeling (CI-M)
14.33
Research and Communication in Economics:
Topics, Methods, and Implementation (CI-M)
Elective Subjects
Select one of the following computer science electives: 12
6.207[J] Networks
15.053 Optimization Methods in Business Analytics
Select three economics electives from the list below, including
at least one subject from each group
36
Unrestricted Electives
48-5
7
Units in Major
183-
186
11
Units in Major That Also Satisfy the GIRs
(48-6
0)
Total Units Beyond the GIRs Required for SB Degree
180-
186
La tabla anterior engloba la ciencia de datos para la aplicación en economía. La
OSSU (Open Source Society University) ha generado un mapa curricular general
para ciencia de datos (Shouvik & University, 2017), listando las asignaturas en la
Tabla 2:
12
Tabla 2. Asignaturas según la OSSU
Linear Algebra
Single Variable Calculus
Multivariable Calculus
Python
Probability and Statistics
Introduction to Data Science
Machine Learning
Project
Convex Optimization
Data Wrangling
Big Data
Database
Deep Learning
Natural Language Processing
Capstone Project
Specializations:
Machine Learning Nanodegree by Google
Data Scientist Nanodegree
Data Science and Engineering with Apache Spark
Data Mining Specialization
Machine Learning Specialization
Data Science Specialization:
– Statistics with R
– Data Science at Scale
– Data Science
13
Big Data Analytics
Las tablas anteriores sientan las bases de los conocimientos necesarios para ser un
científico de datos.
14
RESULTADOS
La entrevista
Entrevista realizada al Dr. Julian Valencia Nava, científico de datos de Centrum Transgenia.
Hola Dr., muchas gracias por acceder a ésta pequeña entrevista acerca de la ciencia de
datos. ¿Me podría responder algunas preguntas?
Por supuesto, ataca.
¿Qué es la ciencia de datos?
La ciencia de datos es el compendio de conocimientos y procesos para extraer la
información que existe en los datos. Básicamente es el uso de muchas herramientas
matemáticas y computacionales para sacar el mejor partido a los datos que se tienen.
¿Cuál es su importancia?
Actualmente muchas empresas tienen cantidades enormes de datos acerca de muchas
cosas, por ejemplo, en tu teléfono tienes google maps, waze, whatsapp y facebook, ¿cierto?
– Así es, ¿quién no? (risas de ambos) – Bueno, pues te platico que le estás dando tanto a
Google como a Facebook toda la información de a dónde vas, con qué regularidad, qué
compras, qué planeas comprar, qué ya has comprado, cuánto te tardas en ir, si tienes carro
o usas transporte público, cuáles son tus búsquedas en internet. Básicamente saben más
de ti que tu mismo. Pero esa información es ​Raw data o datos crudos, para darle valor a
ellos, se requiere de un análisis de esos datos para crear un perfil de cada persona. Solo
haz las cuentas: en éste edificio la cantidad de información que hay por día, ¿Aterrador,
verdad?. Pues ahí radica la importancia de la cienca de datos, darle valor a los datos por
volumen.
¿Qué materias se relacionan con la ciencia de datos?
Principalmente la estadística, uso de tecnologías como big data y small data, analítica
predictiva, machine learning, minería de datos.
¿Cuál es la necesidad en la industria de la ciencia de datos?
15
El objetivo de la industria es venderte. Si te conoce, sabe lo que necesitas y así puede usar
eso para venderte más o venderte mejor. Además, siempre se busca abaratar los costos de
producción, así que saber en qué invertir y cuándo es uno de los datos más buscados por la
industria.
¿Que se necesita estudiar para ser un científico de datos?
Básicamente, una ingeniería en sistemas y mucha matemática.
¿Cuánto tiempo se tarda uno para ser científico de datos?
Depende de cada uno, es un proceso en el conocimiento que vas adquiriendo con los años.
Si eres afortunado y comenzaste pronto, un buen científico de datos se puede considerar
con 10 años de experiencia.
Una pregunta muy personal, ¿Es tarde para mi formarme en la ciencia de datos?
(Risas sinceras de él… nerviosas mías.) Mi estimado, usted ya es Doctor y por lo que me
comentas, estás estudiando una licenciatura en matemática. Ya deberías de estar
ayudándome a mí con los pendientes en la empresa. (Más risas)
Comentarios finales
La ciencia de datos no es para todos, en realidad se ve muy interesante, pero si no te
gustan las matemáticas y la programación, mejor dedícate a otra cosa. Si es intenso y
requiere de mucha concentración, pero ¿Qué trabajo no?
● Muchas gracias por todas sus atenciones. Hasta pronto
16
La encuesta
Descripción de la muestra
Se realizó la encuesta a 29 personas, con estudios universitarios o superiores y
profesionistas de diferentes áreas de conocimiento, entre ellos médicos, psicólogos,
economistas, graduados en letras alemanas y estudiantes de ingenierías y
matemáticas, residentes en México con un rango de edad de 20 a 50 años.
Datos demográficos
La participación de los hombres es del 57.14%
La edad de las personas encuestadas se encuentra en un rango de 20 a 50 años,
siendo la media de 29 años aunque con una tendencia hacia los 20.
17
La muestra está bastante bien equilibrada, tomando como participación mayor 3
áreas: Ingenierías, ciencias sociales y ciencias de la salud, cada una con 25%;
seguida por las ciencias económicas con 17% y una participación de apenas 7% de
personas dedicadas a las artes.
Los encuestados son mayormente del área metropolitana, sin embargo, se tiene
participación de otros estados como Veracruz, Sinaloa, Nayarit y Jalisco.
18
La participación mayoritaria es de pasantes, es decir, personas que han terminado
los créditos académicos suficientes para contratarse, pero no tienen título. Seguidos
por estudiantes y personas con la universidad terminada, solo se cuenta con un
3.57% de personas con estudios de posgrado.
19
Percepción y necesidad de la ciencia de datos
Más del 64% habían escuchado acerca de la ciencia de datos, el 25% no lo había
escuchado lo que es un porcentaje grande comparado con el uso que tiene en las
diferentes áreas.
Casi el 90% de las personas trabajan con muchos datos en su día a día, solamente
el 3.57% de la muestra no trabaja con muchos datos.
El método de procesamiento de datos es principalmente para hacer estadísticas o
registros en una base de datos. Seguido de las personas que usan excel para
almacenar y tratar sus datos. Aunque no es discriminable el hecho de que el 21% de
20
las personas siguen adquiriendo y conservando sus datos en hojas o archivos
simples.
Para el análisis de la percepción de la necesidad de las ciencias de datos en
diferentes áreas de conocimiento, se realizaron preguntas específicas en general,
los datos presentan las medias en gráficas divididas por áreas de conocimiento.
La ciencia de datos y las ciencias exactas. En un rango de 3.82 a 4.43 y con 4.17
como media de necesidad, se posiciona como el área curricular más importante,
dejando a la analítica predictiva con la posición más baja.
21
Sucede lo mismo con la ciencia de la computación con una media de 4.01, en donde
se toma un rango de 3.5 a 4.36, se percibe como un área no tan necesaria como el
de las ciencias exactas, pero con temas imprescindibles.
Las ciencias sociales tienen una media de 3.27 con un rango que va de 2.68 en
derecho hasta 3.57 en economía y econometría. Es una de las áreas de mayor
aplicación de las ciencias de datos.
Las ciencias de la salud no se presentan en el currículo necesario sino para la
aplicación de las técnicas. Con una media de 3.17 y un rango que va de 3.07 a 3.32.
22
El área de conocimiento que tiene menos relación con la ciencia de datos es el de
las artes, con un frío 2.68 de media de necesidad se posiciona como un área muy
alejada.
El área que tiene la mayor importancia en la ciencia de datos es la estadística,
seguida por las matemáticas y la programación. Mercadotecnia y medicina son las
ciencias más apartadas con respecto a la necesidad curricular para desarrollar la
ciencia de datos.
23
Sin embargo, para la aplicación de las ciencas de datos, el más requerido es el área
de ciencias de la salud para poder llevar un seguimiento de pacientes así como el
área económica financiera, para el modelado, simulación y predicción.
En general, se considera sumamente importante la ciencia de datos en cada una de
las áreas de conocimiento, no se tiene una negación absoluta en ninguna de ellas, y
se marca una tendencia hacia lo imprescindible.
24
En todas las personas se encontró interés por conocer más acerca de la ciencia de
datos, solo el 3.5% de los encuestados dudaron de la importancia de tener ese
conocimiento, sin embargo, es notable el interés despertado en el tema.
La ciencia de datos es un conjunto de temas de diferentes áreas de conocimiento
que se va adaptando y aplicando en la industria. La importancia de crear carreras
especializadas en el manejo de los datos se ve muy presente y necesaria.
25
26
CONCLUSIONES Y RECOMENDACIONES
● La ciencia de datos es un proceso de transformación de datos a conocimiento de
valor para la industria y la investigación.
● Los principales temas en negocios y finanzas son la economía y la econometría ya
que es a través de sus métodos de dónde se obtendrá el valor de los datos para la
toma de las decisiones.
● La ciencia de datos usa procesos de recolección y minería de datos, son
almacenados en bases de datos de donde se pueden consultar para ordenar,
limpiar, presentar y analizar los datos de manera primaria a través de la matemática
y la estadística. Crea hipótesis a través de los datos crudos analizados y recaba las
principales características que generan valor. De ésta información ya procesada, se
programan algoritmos y modelos de simulación y aprendizaje automático para crear
modelos predictivos. Se presentan los datos a través de gráficas y visualizaciones
interactivas. Todo ésto con la finalidad de ayudar a una toma de decisiones
inteligente para la industria.
27
REFERENCIAS
Para realizar la investigación, se ha elaborado una búsqueda de fuentes de información y
referencias. Se organizan por primarias y secundarias así como por el tema:
Fuentes primarias: Crean el valor curricular de la ciencia de datos.
MIT. (9 de mayo de 2019). Computer Science, Economics, and Data Science (Course 6-14).
Obtenido de mit.edu:
http://catalog.mit.edu/degree-charts/computer-science-economics-data-science-cours
e-6-14/
Shouvik, R., & University, O. O. (9 de Octubre de 2017). Path to a free self-taught education
in Data Science! Obtenido de GitHub: ​https://github.com/ossu/data-science
Fuentes secundarias: Explican, detallan y aplican la ciencia de datos
Dhar, V. (2012). Data Science and Prediction. NYU Working Paper No. 2451/31635, 13.
Edureka. (6 de Diciembre de 2018). Data Analyst vs Data Engineer vs Data Scientist | Data
Analytics Masters Program | Edureka. Obtenido de Youtube:
https://www.youtube.com/watch?v=ioZNNfxXXqo
Provost, F., & Fawcett, T. (2013). Data Science for Business. Sebastopol. California: O’Reilly
Media.
Provost, F., & Fawcett, T. (Marzo 2013). Data Science and its Relationship to Big Data and
Data-Driven Decision Making. Big Data.
Science, 3. D. (8 de marzo de 2019). What Do You Need to Become a Data Scientist in
2019? Obtenido de youtube: ​https://www.youtube.com/watch?v=UXi8Ml2UoYk
Simplilearn. (4 de Diciembre de 2018). Data Science In 5 Minutes | Data Science For
Beginners | What Is Data Science? | Simplilearn. Obtenido de youtube:
https://www.youtube.com/watch?v=X3paOmcrTjQ
Waller, M., & Fawcett, S. (2013). Data Science, Predictive Analytics, and Big Data: A
Revolution That Will Transform Supply Chain Design and Management. Journal of
business logistics: Volume34, Issue2, 77-84.
28
Secundarias: Ayudan a realizar el proceso de obtención y organización de la información
Ceballos Giles, L., Galvan Aleman, S., & Orozco Guerrero, E. (9 de Agosto de 2015).
Registro de bibliografía en Formato APA en Word Libros Ver 6. Obtenido de
Youtube: ​https://www.youtube.com/watch?v=b5TczzZtMjw&feature=youtu.be
Maglione, C., & Varlotta, N. (2012). Investigación, gestión y búsqueda de información en
internet. Buenos Aires, Argentina: ANSES.
29
ANEXOS
En ésta sección se agregan los instrumentos para la obtención de datos en campo, se
realizaron tres instrumentos: una bitácora de investigación, una entrevista con un experto en
el área de ciencia de datos y una encuesta a un público general.
Bitácora de investigación
Fecha: 19 de mayo de 2019
Este cuaderno tiene poco valor para otra persona que no sea su dueño; Sin embargo, es
muy necesario para ayudar a otras personas. Por ello, si en algún momento se extraviara y
usted lo encuentra, le rogaré encarecidamente avisar al DCC Gabino Ramírez en la
siguiente dirección de correo electrónico: jadwer@msn.com.
Le expreso el más sincero agradecimiento por el noble gesto de devolver este cuaderno, ya
que con ello estará ayudando a otras personas.
17 de mayo de 2019
Se realizó una visita a Centrum Transgenia, una empresa dedicada a la innovación
tecnológica a través de la Industria 4.0. Es una empresa que usa la ciencia de datos para
las empresas.
Actividad 1.
Llegué temprano, a las 9:45 a las oficinas de Centrum Transgenia, ubicadas en Camelia 94,
Ecatepec de Morelos, Estado de México, México.
Actividad 2.
Me recibió una señorita en recepción, la cuál me solicitó una identificación oficial para
darme una credencial que me llevó al piso de Transgenia
Actividad 3.
A las 10:00 me recibió la recepcionista de la empresa, la cuál se comunicó con la Lic.
Noemí L, encargada de ventas. Nos presentamos y le recordé el objetivo de la visita y con
una sonrisa accedió amablemente a darme un recorrido por las oficinas.
30
Actividad 4.
a las 10:10 comenzamos el recorrido, obviamos la recepción y la sala de juntas, que es en
donde me recibió y me permitió dejar el resto de mis cosas.
Actividad 5.
Pasamos al área administrativa, que es la más pequeña de toda la empresa. Ahí había 3
personas trabajando en la contabilidad de la empresa.
Actividad 6.
Seguimos al área de innovación tecnológica, básicamente es un departamento con una sola
mesa grande al centro, y lugares asignados para las personas que trabajan ahí. Son todos
ingenieros de diferentes carreras que se coordinan para solucionar diferentes solicitudes.
Trabajan en Internet de las Cosas, Análisis de sentimientos, robótica adaptativa,
Tecnologías de virtualización, Sensores y muchas otras cosas que tienen que ver con
innovación.
Actividad 7.
Fuimos al área de ciencia de datos, ésta área es más callada. Son ingenieros también, pero
cada uno tiene un cubículo. Ellos son personas que programan y analizan muchos datos a
través de servidores en la nube.
Actividad 8.
Me presentaron al Dr. Julián V. director de área Data Science. Con él acordé una cita
posterior ese mismo día para realizarle una entrevista acerca de la ciencia de datos y
accedió sin problema.
Actividad 9.
Fui nuevamente por mis cosas, me despedí de la Lic Noemí L. y le agradecí inmensamente
su ayuda.
Actividad 10.
Recogí mi credencial a la salida y avisé que volvería en unas horas. Parece que no le
interesó.
31
Actividades no realizadas
En ése momento no pude realizar la entrevista debido a que el Dr. estaba atendiendo un
tema con su equipo.
Hallazgos importantes
De la visita a la empresa, tuve la oportunidad de ver la manera en la que se trabaja como
innovador tecnológico y la infraestructura de una empresa dedicada a la Industria 4.0.
Conocí al Dr. Julián V. director y especialista en ciencias de datos.
Impacto de la experiencia
Con ésta investigación, se obtiene claridad con respecto al trabajo real de científicos de
datos. Cómo y en dónde lo realizan. Además de la estructura e impacto que tienen en la
sociedad.
32
La entrevista
¿Qué es la ciencia de datos?
¿Cuál es su importancia?
¿Qué materias se relacionan con la ciencia de datos?
¿Cuál es la necesidad en la industria de la ciencia de datos?
¿Que se necesita estudiar para ser un científico de datos?
¿Cuánto tiempo se tarda uno para ser científico de datos?
Una pregunta muy personal, ¿Es tarde para mi formarme en la ciencia de datos?
Comentarios finales
La encuesta
La siguiente encuesta está dirigida a profesionistas y universitarios con el fin de identificar la relación 
de la ciencia de datos con las diferentes áreas de conocimiento. 
Demográficos
Las siguientes preguntas tienen la finalidad de segmentar los resultados. No se solicita
ningún dato personal.
Género
Mujer Hombre
Edad (Solo números)
Nivel de estudios
Universidad en curso o trunca Pasante
Titulado
Maestría
Doctorado
Técnico Superior Universitario
Área de conocimientos
33
Agronomía
veterinaria y afines Bellas artes
Ciencias de la educación
Ciencias de la salud
Ciencias sociales y humanas
Economía, administración, contaduría y
afines
Ingeniería, arquitectura, urbanismo y
afines
Matemáticas y ciencias naturales
Estado
Aguascalientes
Baja California
Baja California Sur
Campeche
Coahuila
Colima
Chiapas
Chihuahua
Ciudad de México
Durango
Guanajuato
Guerrero
Hidalgo
Jalisco
Estado de México
Michoacán
Morelos
Nayarit
Nuevo León
Oaxaca
Puebla
Querétaro
Quintana Roo
San Luis Potosí
Sinaloa
Sonora
Tabasco
Tamaulipas
Tlaxcala
Veracruz
Yucatán
Zacatecas
34
La ciencia de datos
En ésta sección realizaremos preguntas acerca de la relación que tienes con la ciencia de
datos o las áreas que la integran.
¿Haz escuchado el término Ciencia de Datos o Data Science?
Sí No Tal vez
En tu profesión ¿Se manejan muchos datos?
Sí No Tal vez
¿Cuál es el método más común para procesar, mostrar y ordenar los datos?
Estadística
Excel
Un programa informático
Presentaciones en Power Point o similar
Registro en hojas
Registro de datos en archivos
¿Cuál es la importancia de cada una de las siguientes materias con relación a la
ciencia de datos?
Nada importante
Poco importante
Regularmente importante
Muy importante
Imprescindible
Matemáticas
Estadística
Literatura
Procesamiento de lenguaje natural
Computación
Artes
Programación
Bases de datos
Minería de datos
Música
Derecho
Biología
35
Mercadotecnia
Aprendizaje automático
Modelado matemático
Medicina
Analítica predictiva
Economía
Econometría
Probabilidad
Psicología
Producción audiovisual
Matemáticas
Estadística
Literatura
Procesamiento de lenguaje natural
Computación
Artes
Programación
Bases de datos
Minería de datos
Música
Derecho
Biología
Mercadotecnia
Aprendizaje automático
Modelado matemático
Medicina
Analítica predictiva
Economía
Econometría
Probabilidad
Psicología
Producción audiovisual
Selecciona el área de conocimientos que consideres que tiene la mayor importancia
para la ciencia de datos
Matemáticas
Estadística
Literatura
Procesamiento de lenguaje natural
Computación
Artes
Programación
Bases de datos
Minería de datos
Música
36
Derecho
Biología
Mercadotecnia
Aprendizaje automático
Modelado matemático
Medicina
Analítica predictiva
Economía
Econometría
Probabilidad
Psicología
Producción audiovisua
¿Qué tan importante consideras que es la ciencia de datos con relación a tu
profesión?
Nada importante 1 2 3 4 5 Muy importante
37
¿En qué se podría usar la ciencia de datos en tu profesión?
Experimentación
Seguimiento de pacientes
Modelado de comportamientos
Predicción de compras/ventas
Procesamiento de muchos datos
Análisis automático
Ordenamiento automático
¿Qué tan importante consideras la creación de nuevas carreras especializadas en
ciencia de datos?
Nada importante 1 2 3 4 5 Muy importante
¿Cuántas horas al día ves la tv?
0 a 2 3 a 5 5 a 8 Más de 8 horas
¿Te interesaría conocer más acerca de éste tema?
Sí No Tal vez
¡Te invito a visitar mi blog!
Puedes conocer más acerca de ésta investigación entrando a​ https://jadwer.wordpress.com/
Agradecemos tu participación, ésta encuesta es importante para la investigación.
38

Más contenido relacionado

Similar a Data Science: correlación curricular

Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...
Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...
Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...Alex Rayón Jerez
 
Silabus ingenieria informacion_2011-0_ver1
Silabus ingenieria informacion_2011-0_ver1Silabus ingenieria informacion_2011-0_ver1
Silabus ingenieria informacion_2011-0_ver1Jose Evanan
 
Proyecto evaluacion entre_pares_marco_polo_sanchez_farfan
Proyecto evaluacion entre_pares_marco_polo_sanchez_farfanProyecto evaluacion entre_pares_marco_polo_sanchez_farfan
Proyecto evaluacion entre_pares_marco_polo_sanchez_farfanMarcoPoloSanchez1
 
Planificador de proyectos hasta el punto 7
Planificador de proyectos hasta el punto 7Planificador de proyectos hasta el punto 7
Planificador de proyectos hasta el punto 7Paulita HR
 
Planificador de proyectos nueva versión
Planificador de proyectos nueva versiónPlanificador de proyectos nueva versión
Planificador de proyectos nueva versióndifemen
 
Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01Paulita HR
 
Planificador de proyectos nueva versión
Planificador de proyectos nueva versiónPlanificador de proyectos nueva versión
Planificador de proyectos nueva versióndifemen
 
Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01Paulita HR
 
SYLLABUS PROBABILIDADES Y ESTADÍSTICA
SYLLABUS PROBABILIDADES Y ESTADÍSTICASYLLABUS PROBABILIDADES Y ESTADÍSTICA
SYLLABUS PROBABILIDADES Y ESTADÍSTICAMiltonValarezo
 
Planificador de proyectos terminado
Planificador de proyectos terminadoPlanificador de proyectos terminado
Planificador de proyectos terminadoPaulita HR
 
Planificador de proyectos hasta el punto 11
Planificador de proyectos hasta el punto 11Planificador de proyectos hasta el punto 11
Planificador de proyectos hasta el punto 11Paulita HR
 
Planificador de proyectos Terminado
Planificador de proyectos TerminadoPlanificador de proyectos Terminado
Planificador de proyectos TerminadoPaulita HR
 
maestria oficial ciencia-datos apiicado a la estadistia.pdf
maestria oficial ciencia-datos apiicado a la estadistia.pdfmaestria oficial ciencia-datos apiicado a la estadistia.pdf
maestria oficial ciencia-datos apiicado a la estadistia.pdfDemsshillCoutino
 
Estadìstica fundamentos
Estadìstica fundamentosEstadìstica fundamentos
Estadìstica fundamentostavoc
 
Planificadordeproyectosnuevaversin 140622122513-phpapp02
Planificadordeproyectosnuevaversin 140622122513-phpapp02Planificadordeproyectosnuevaversin 140622122513-phpapp02
Planificadordeproyectosnuevaversin 140622122513-phpapp02Paulita HR
 

Similar a Data Science: correlación curricular (20)

Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...
Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...
Smart Data para la mejora de la educación y sus procesos de enseñanza aprendi...
 
Silabus ingenieria informacion_2011-0_ver1
Silabus ingenieria informacion_2011-0_ver1Silabus ingenieria informacion_2011-0_ver1
Silabus ingenieria informacion_2011-0_ver1
 
Guia General Programas Inteligencia de Negocio y Big data 17/19
Guia General Programas Inteligencia de Negocio y Big data 17/19Guia General Programas Inteligencia de Negocio y Big data 17/19
Guia General Programas Inteligencia de Negocio y Big data 17/19
 
PAPER. estadisticasdocx
PAPER. estadisticasdocxPAPER. estadisticasdocx
PAPER. estadisticasdocx
 
Guía estudiantes Máster Inteligencia negocio octubre 2018
Guía estudiantes Máster Inteligencia negocio octubre 2018 Guía estudiantes Máster Inteligencia negocio octubre 2018
Guía estudiantes Máster Inteligencia negocio octubre 2018
 
Proyecto evaluacion entre_pares_marco_polo_sanchez_farfan
Proyecto evaluacion entre_pares_marco_polo_sanchez_farfanProyecto evaluacion entre_pares_marco_polo_sanchez_farfan
Proyecto evaluacion entre_pares_marco_polo_sanchez_farfan
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 
Planificador de proyectos hasta el punto 7
Planificador de proyectos hasta el punto 7Planificador de proyectos hasta el punto 7
Planificador de proyectos hasta el punto 7
 
Planificador de proyectos nueva versión
Planificador de proyectos nueva versiónPlanificador de proyectos nueva versión
Planificador de proyectos nueva versión
 
Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01
 
Planificador de proyectos nueva versión
Planificador de proyectos nueva versiónPlanificador de proyectos nueva versión
Planificador de proyectos nueva versión
 
Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01Planificadordeproyectosnuevaversin 140613100514-phpapp01
Planificadordeproyectosnuevaversin 140613100514-phpapp01
 
SYLLABUS PROBABILIDADES Y ESTADÍSTICA
SYLLABUS PROBABILIDADES Y ESTADÍSTICASYLLABUS PROBABILIDADES Y ESTADÍSTICA
SYLLABUS PROBABILIDADES Y ESTADÍSTICA
 
Planificador de proyectos terminado
Planificador de proyectos terminadoPlanificador de proyectos terminado
Planificador de proyectos terminado
 
Planificador de proyectos hasta el punto 11
Planificador de proyectos hasta el punto 11Planificador de proyectos hasta el punto 11
Planificador de proyectos hasta el punto 11
 
Planificador de proyectos Terminado
Planificador de proyectos TerminadoPlanificador de proyectos Terminado
Planificador de proyectos Terminado
 
maestria oficial ciencia-datos apiicado a la estadistia.pdf
maestria oficial ciencia-datos apiicado a la estadistia.pdfmaestria oficial ciencia-datos apiicado a la estadistia.pdf
maestria oficial ciencia-datos apiicado a la estadistia.pdf
 
Guía General Inteligencia Negocio y Big Data_Octubre 2017
Guía General Inteligencia Negocio y  Big Data_Octubre 2017Guía General Inteligencia Negocio y  Big Data_Octubre 2017
Guía General Inteligencia Negocio y Big Data_Octubre 2017
 
Estadìstica fundamentos
Estadìstica fundamentosEstadìstica fundamentos
Estadìstica fundamentos
 
Planificadordeproyectosnuevaversin 140622122513-phpapp02
Planificadordeproyectosnuevaversin 140622122513-phpapp02Planificadordeproyectosnuevaversin 140622122513-phpapp02
Planificadordeproyectosnuevaversin 140622122513-phpapp02
 

Último

Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfEDUARDO MAMANI MAMANI
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 

Último (20)

Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 

Data Science: correlación curricular

  • 1. CURSO DE INTEGRACIÓN A LA VIDA UNIVERSITARIA Curso propedéutico para el aprendizaje autogestivo en un ambiente virtual 2019-2 Unidad 3. Gestión de información para la investigación Informe final Data Science: correlación curricular Nombre del aspirante: ​Rodrigo Gabino Ramírez Moreno División y/o Aula: División de Ciencias Exactas, Ingenierías y Tecnologías (CEIT) Grupo: ​Gp 044 Nombre del monitor(a): ​Noemí Navarrete Aguirre Dirección del blog:​ ​https://jadwer.wordpress.com/ Fecha: 29 de mayo de 2019 1
  • 2. INTRODUCCIÓN 4 Justificación 4 Objetivo general 4 Objetivos específicos 4 METODOLOGÍA 5 Plan de trabajo 5 Investigación de documental 5 Investigación de campo 5 Bitácora de investigación 5 Entrevista 6 Encuesta 6 MARCO TEÓRICO 8 Científico de datos 8 Definición 9 Ciclo de vida 9 Bases curriculares 10 RESULTADOS 15 La entrevista 15 La encuesta 17 Descripción de la muestra 17 Datos demográficos 17 Percepción y necesidad de la ciencia de datos 20 CONCLUSIONES Y RECOMENDACIONES 27 REFERENCIAS 28 ANEXOS 30 Bitácora de investigación 30 La entrevista 33 La encuesta 33 2
  • 4. INTRODUCCIÓN La cantidad de información que se tiene actualmente acerca de cualquier tema obliga de manera imperante a tener estrategias, metodologías y herramientas que nos permitan ordenar, categorizar y obtener un valor de los datos que se tienen. Para éste propósito existen temas muy puntuales que se categorizan dentro de la ciencia de datos. Justificación Adentrarse en la ciencia de datos es una tarea ardua debido a la magnitud de la aplicación y a los límites casi borrosos que se tiene entre algunas áreas del conocimiento donde se aplica. Por lo anterior, es importante tener un compendio breve pero informado de los temas que se relacionan con la ciencia de datos y por qué es necesario para su uso. Objetivo general Crear un panorama relacional de las áreas del conocimiento que se relacionan con la ciencia de datos, además de definir qué son, para qué sirven y de qué manera se utilizan en el ciclo de vida del tratamiento de los datos. Objetivos específicos ● Recopilar la información de los temas que dan lugar a la ciencia de datos ● Cuál es el ciclo de vida de la ciencia de datos ● Qué herramientas existen y en qué casos se aplican ● Cómo se relacionan las ciencias de la computación / TI ● Temas necesarios de Matemáticas y estadística ● Conocimientos en negocios y finanzas 4
  • 5. METODOLOGÍA La metodología utilizada en el presente trabajo se describe a continuación. Plan de trabajo El plan de trabajo se dividió en la definición del problema y objetivos general y particulares. Así como la calendarización de la investigación documental y de campo, para concluir con la elaboración del presente trabajo y la presentación de los resultados. Investigación de documental Para realizar ésta investigación, se llevó a cabo una búsqueda documental de los términos, definiciones y aplicaciones de la ciencia de datos. La herramienta principal para la búsqueda de información fue google académico, sin embargo, se encontró información valiosa en buscadores como Scielo, Alicia, Youtube y Wikipedia, no como fuente sino como proveedor de referencias acerca del tema. Investigación de campo Bitácora de investigación 17 de mayo de 2019 Se realizó una visita a Centrum Transgenia, una empresa dedicada a la innovación tecnológica a través de la Industria 4.0. Es una empresa que usa la ciencia de datos para las empresas. 5
  • 6. Entrevista Entrevista realizada al Dr. Julian Valencia Nava, científico de datos de Centrum Transgenia. Encuesta Dirigida a profesionistas y universitarios con el fin de identificar la relación de la ciencia de datos con  las diferentes áreas de conocimiento. Los datos fueron analizados usando la aplicación de IBM Stata. 6
  • 7. 7
  • 8. MARCO TEÓRICO El motivo de la presente investigación es la de recopilar el contexto curricular necesario para establecer las relaciones dentro del ámbito de la ciencia de datos, para ello definiremos la ciencia de datos, las bases curriculares y el contexto social necesario para ser un científico de datos. Científico de datos La cantidad de datos que se manejan actualmente, gracias a las tecnologías y conexión ubicua existente hacen poco manejables los datos crudos y mal estructurados, de ahí surge la necesidad de tener personas especializadas en el manejo correcto de toda esa información. La evolución que se ha presentado a través de las necesidades de las empresas dan creación a puestos específicos. (Edureka, 2018). ● Analista de datos: Toma los datos y los usan para ayudar a las empresas a tomar mejores decisiones de negocio. El proceso básico que siguen es: ○ Recolección de datos ○ Análisis de los datos ○ Creación de reportes ● Ingeniero de datos: Son los que desarrollan, construyen, prueban y mantienen la arquitectura completa del SISTEMA DE PROCESAMIENTO A GRAN ESCALA a través de la configuración de tuberías de datos. ● Científico de datos: Es un profesional que trata con enormes cantidades de datos estructurados/no-estructurados y usa sus habilidades en matemáticas, estadística, programación, machine learning, etc. Para presentar la visualización del estado de los datos analizados para la toma de decisiones de negocios. 8
  • 9. O dicho de una manera más sencilla, un científico de datos es la persona con las habilidades de minar los datos no estructurados, de desarrollar algoritmos de análisis, implementar modelos y métodos de proyección y aprendizaje automatizado y desplegar un resultado eficiente para la toma de decisiones. (Science, 2019). Definición La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva. (Liu, 2015) Ciclo de vida Comprensión de la necesidad. O entendimiento del negocio, realiza las preguntas relevantes y define objetivos para el problema que se necesita resolver. 9
  • 10. Minería de datos. ​Busca y obtiene los datos necesarios para el proyecto Limpieza de los datos. ​Arregla las inconsistencias con los datos y maneja los valores perdidos. Exploración de los datos. ​Se crean las hipótesis de la definición del problema por el análisis visual de los datos. Ingeniería de características. ​Busca las características importantes y construye algunos significados a través de los datos crudos que se tienen. Modelado predictivo - simulación. ​Entrenamiento del aprendizaje automático a través de Machine Learning, evalúa su rendimiento y lo usa para crear predicciones. Visualización de los datos. ​Comunicar los resultados a las partes interesadas clave a través de gráficas y visualizaciones interactivas Bases curriculares Con base en el programa del MIT (MIT, 2019), se obtiene el plan de estudios mostrado en la Tabla 1: Tabla 1: Plan de estudios del Instituto Tecnológico de Massachusetts (MIT) Required Subjects Units Mathematics 18.06 Linear Algebra 12 Computation/Algorithms 6.0001 Introduction to Computer Science Programming in Python 6 6.009 Fundamentals of Programming 1 12 6.006 Introduction to Algorithms 12 6.042[J] Mathematics for Computer Science 12 6.046[J] Design and Analysis of Algorithms 12 Economics 10
  • 11. 14.01 Principles of Microeconomics 2 12 14.32 Econometric Data Science 12 Introductory Probability and Statistics Select one of the following: 12 6.041A & ​6.041B Introduction to Probability I and Introduction to Probability II 14.30 Introduction to Statistical Methods in Economics 18.600 Probability and Random Variables Data Science 6.036 Introduction to Machine Learning 12 Project-based 6.UAT Oral Communication (CI-M) 3 9-12 or 15.276 Communicating with Data Select one of the following: 12 14.05 Intermediate Macroeconomics (CI-M) 4 14.18 Mathematical Economic Modeling (CI-M) 14.33 Research and Communication in Economics: Topics, Methods, and Implementation (CI-M) Elective Subjects Select one of the following computer science electives: 12 6.207[J] Networks 15.053 Optimization Methods in Business Analytics Select three economics electives from the list below, including at least one subject from each group 36 Unrestricted Electives 48-5 7 Units in Major 183- 186 11
  • 12. Units in Major That Also Satisfy the GIRs (48-6 0) Total Units Beyond the GIRs Required for SB Degree 180- 186 La tabla anterior engloba la ciencia de datos para la aplicación en economía. La OSSU (Open Source Society University) ha generado un mapa curricular general para ciencia de datos (Shouvik & University, 2017), listando las asignaturas en la Tabla 2: 12
  • 13. Tabla 2. Asignaturas según la OSSU Linear Algebra Single Variable Calculus Multivariable Calculus Python Probability and Statistics Introduction to Data Science Machine Learning Project Convex Optimization Data Wrangling Big Data Database Deep Learning Natural Language Processing Capstone Project Specializations: Machine Learning Nanodegree by Google Data Scientist Nanodegree Data Science and Engineering with Apache Spark Data Mining Specialization Machine Learning Specialization Data Science Specialization: – Statistics with R – Data Science at Scale – Data Science 13
  • 14. Big Data Analytics Las tablas anteriores sientan las bases de los conocimientos necesarios para ser un científico de datos. 14
  • 15. RESULTADOS La entrevista Entrevista realizada al Dr. Julian Valencia Nava, científico de datos de Centrum Transgenia. Hola Dr., muchas gracias por acceder a ésta pequeña entrevista acerca de la ciencia de datos. ¿Me podría responder algunas preguntas? Por supuesto, ataca. ¿Qué es la ciencia de datos? La ciencia de datos es el compendio de conocimientos y procesos para extraer la información que existe en los datos. Básicamente es el uso de muchas herramientas matemáticas y computacionales para sacar el mejor partido a los datos que se tienen. ¿Cuál es su importancia? Actualmente muchas empresas tienen cantidades enormes de datos acerca de muchas cosas, por ejemplo, en tu teléfono tienes google maps, waze, whatsapp y facebook, ¿cierto? – Así es, ¿quién no? (risas de ambos) – Bueno, pues te platico que le estás dando tanto a Google como a Facebook toda la información de a dónde vas, con qué regularidad, qué compras, qué planeas comprar, qué ya has comprado, cuánto te tardas en ir, si tienes carro o usas transporte público, cuáles son tus búsquedas en internet. Básicamente saben más de ti que tu mismo. Pero esa información es ​Raw data o datos crudos, para darle valor a ellos, se requiere de un análisis de esos datos para crear un perfil de cada persona. Solo haz las cuentas: en éste edificio la cantidad de información que hay por día, ¿Aterrador, verdad?. Pues ahí radica la importancia de la cienca de datos, darle valor a los datos por volumen. ¿Qué materias se relacionan con la ciencia de datos? Principalmente la estadística, uso de tecnologías como big data y small data, analítica predictiva, machine learning, minería de datos. ¿Cuál es la necesidad en la industria de la ciencia de datos? 15
  • 16. El objetivo de la industria es venderte. Si te conoce, sabe lo que necesitas y así puede usar eso para venderte más o venderte mejor. Además, siempre se busca abaratar los costos de producción, así que saber en qué invertir y cuándo es uno de los datos más buscados por la industria. ¿Que se necesita estudiar para ser un científico de datos? Básicamente, una ingeniería en sistemas y mucha matemática. ¿Cuánto tiempo se tarda uno para ser científico de datos? Depende de cada uno, es un proceso en el conocimiento que vas adquiriendo con los años. Si eres afortunado y comenzaste pronto, un buen científico de datos se puede considerar con 10 años de experiencia. Una pregunta muy personal, ¿Es tarde para mi formarme en la ciencia de datos? (Risas sinceras de él… nerviosas mías.) Mi estimado, usted ya es Doctor y por lo que me comentas, estás estudiando una licenciatura en matemática. Ya deberías de estar ayudándome a mí con los pendientes en la empresa. (Más risas) Comentarios finales La ciencia de datos no es para todos, en realidad se ve muy interesante, pero si no te gustan las matemáticas y la programación, mejor dedícate a otra cosa. Si es intenso y requiere de mucha concentración, pero ¿Qué trabajo no? ● Muchas gracias por todas sus atenciones. Hasta pronto 16
  • 17. La encuesta Descripción de la muestra Se realizó la encuesta a 29 personas, con estudios universitarios o superiores y profesionistas de diferentes áreas de conocimiento, entre ellos médicos, psicólogos, economistas, graduados en letras alemanas y estudiantes de ingenierías y matemáticas, residentes en México con un rango de edad de 20 a 50 años. Datos demográficos La participación de los hombres es del 57.14% La edad de las personas encuestadas se encuentra en un rango de 20 a 50 años, siendo la media de 29 años aunque con una tendencia hacia los 20. 17
  • 18. La muestra está bastante bien equilibrada, tomando como participación mayor 3 áreas: Ingenierías, ciencias sociales y ciencias de la salud, cada una con 25%; seguida por las ciencias económicas con 17% y una participación de apenas 7% de personas dedicadas a las artes. Los encuestados son mayormente del área metropolitana, sin embargo, se tiene participación de otros estados como Veracruz, Sinaloa, Nayarit y Jalisco. 18
  • 19. La participación mayoritaria es de pasantes, es decir, personas que han terminado los créditos académicos suficientes para contratarse, pero no tienen título. Seguidos por estudiantes y personas con la universidad terminada, solo se cuenta con un 3.57% de personas con estudios de posgrado. 19
  • 20. Percepción y necesidad de la ciencia de datos Más del 64% habían escuchado acerca de la ciencia de datos, el 25% no lo había escuchado lo que es un porcentaje grande comparado con el uso que tiene en las diferentes áreas. Casi el 90% de las personas trabajan con muchos datos en su día a día, solamente el 3.57% de la muestra no trabaja con muchos datos. El método de procesamiento de datos es principalmente para hacer estadísticas o registros en una base de datos. Seguido de las personas que usan excel para almacenar y tratar sus datos. Aunque no es discriminable el hecho de que el 21% de 20
  • 21. las personas siguen adquiriendo y conservando sus datos en hojas o archivos simples. Para el análisis de la percepción de la necesidad de las ciencias de datos en diferentes áreas de conocimiento, se realizaron preguntas específicas en general, los datos presentan las medias en gráficas divididas por áreas de conocimiento. La ciencia de datos y las ciencias exactas. En un rango de 3.82 a 4.43 y con 4.17 como media de necesidad, se posiciona como el área curricular más importante, dejando a la analítica predictiva con la posición más baja. 21
  • 22. Sucede lo mismo con la ciencia de la computación con una media de 4.01, en donde se toma un rango de 3.5 a 4.36, se percibe como un área no tan necesaria como el de las ciencias exactas, pero con temas imprescindibles. Las ciencias sociales tienen una media de 3.27 con un rango que va de 2.68 en derecho hasta 3.57 en economía y econometría. Es una de las áreas de mayor aplicación de las ciencias de datos. Las ciencias de la salud no se presentan en el currículo necesario sino para la aplicación de las técnicas. Con una media de 3.17 y un rango que va de 3.07 a 3.32. 22
  • 23. El área de conocimiento que tiene menos relación con la ciencia de datos es el de las artes, con un frío 2.68 de media de necesidad se posiciona como un área muy alejada. El área que tiene la mayor importancia en la ciencia de datos es la estadística, seguida por las matemáticas y la programación. Mercadotecnia y medicina son las ciencias más apartadas con respecto a la necesidad curricular para desarrollar la ciencia de datos. 23
  • 24. Sin embargo, para la aplicación de las ciencas de datos, el más requerido es el área de ciencias de la salud para poder llevar un seguimiento de pacientes así como el área económica financiera, para el modelado, simulación y predicción. En general, se considera sumamente importante la ciencia de datos en cada una de las áreas de conocimiento, no se tiene una negación absoluta en ninguna de ellas, y se marca una tendencia hacia lo imprescindible. 24
  • 25. En todas las personas se encontró interés por conocer más acerca de la ciencia de datos, solo el 3.5% de los encuestados dudaron de la importancia de tener ese conocimiento, sin embargo, es notable el interés despertado en el tema. La ciencia de datos es un conjunto de temas de diferentes áreas de conocimiento que se va adaptando y aplicando en la industria. La importancia de crear carreras especializadas en el manejo de los datos se ve muy presente y necesaria. 25
  • 26. 26
  • 27. CONCLUSIONES Y RECOMENDACIONES ● La ciencia de datos es un proceso de transformación de datos a conocimiento de valor para la industria y la investigación. ● Los principales temas en negocios y finanzas son la economía y la econometría ya que es a través de sus métodos de dónde se obtendrá el valor de los datos para la toma de las decisiones. ● La ciencia de datos usa procesos de recolección y minería de datos, son almacenados en bases de datos de donde se pueden consultar para ordenar, limpiar, presentar y analizar los datos de manera primaria a través de la matemática y la estadística. Crea hipótesis a través de los datos crudos analizados y recaba las principales características que generan valor. De ésta información ya procesada, se programan algoritmos y modelos de simulación y aprendizaje automático para crear modelos predictivos. Se presentan los datos a través de gráficas y visualizaciones interactivas. Todo ésto con la finalidad de ayudar a una toma de decisiones inteligente para la industria. 27
  • 28. REFERENCIAS Para realizar la investigación, se ha elaborado una búsqueda de fuentes de información y referencias. Se organizan por primarias y secundarias así como por el tema: Fuentes primarias: Crean el valor curricular de la ciencia de datos. MIT. (9 de mayo de 2019). Computer Science, Economics, and Data Science (Course 6-14). Obtenido de mit.edu: http://catalog.mit.edu/degree-charts/computer-science-economics-data-science-cours e-6-14/ Shouvik, R., & University, O. O. (9 de Octubre de 2017). Path to a free self-taught education in Data Science! Obtenido de GitHub: ​https://github.com/ossu/data-science Fuentes secundarias: Explican, detallan y aplican la ciencia de datos Dhar, V. (2012). Data Science and Prediction. NYU Working Paper No. 2451/31635, 13. Edureka. (6 de Diciembre de 2018). Data Analyst vs Data Engineer vs Data Scientist | Data Analytics Masters Program | Edureka. Obtenido de Youtube: https://www.youtube.com/watch?v=ioZNNfxXXqo Provost, F., & Fawcett, T. (2013). Data Science for Business. Sebastopol. California: O’Reilly Media. Provost, F., & Fawcett, T. (Marzo 2013). Data Science and its Relationship to Big Data and Data-Driven Decision Making. Big Data. Science, 3. D. (8 de marzo de 2019). What Do You Need to Become a Data Scientist in 2019? Obtenido de youtube: ​https://www.youtube.com/watch?v=UXi8Ml2UoYk Simplilearn. (4 de Diciembre de 2018). Data Science In 5 Minutes | Data Science For Beginners | What Is Data Science? | Simplilearn. Obtenido de youtube: https://www.youtube.com/watch?v=X3paOmcrTjQ Waller, M., & Fawcett, S. (2013). Data Science, Predictive Analytics, and Big Data: A Revolution That Will Transform Supply Chain Design and Management. Journal of business logistics: Volume34, Issue2, 77-84. 28
  • 29. Secundarias: Ayudan a realizar el proceso de obtención y organización de la información Ceballos Giles, L., Galvan Aleman, S., & Orozco Guerrero, E. (9 de Agosto de 2015). Registro de bibliografía en Formato APA en Word Libros Ver 6. Obtenido de Youtube: ​https://www.youtube.com/watch?v=b5TczzZtMjw&feature=youtu.be Maglione, C., & Varlotta, N. (2012). Investigación, gestión y búsqueda de información en internet. Buenos Aires, Argentina: ANSES. 29
  • 30. ANEXOS En ésta sección se agregan los instrumentos para la obtención de datos en campo, se realizaron tres instrumentos: una bitácora de investigación, una entrevista con un experto en el área de ciencia de datos y una encuesta a un público general. Bitácora de investigación Fecha: 19 de mayo de 2019 Este cuaderno tiene poco valor para otra persona que no sea su dueño; Sin embargo, es muy necesario para ayudar a otras personas. Por ello, si en algún momento se extraviara y usted lo encuentra, le rogaré encarecidamente avisar al DCC Gabino Ramírez en la siguiente dirección de correo electrónico: jadwer@msn.com. Le expreso el más sincero agradecimiento por el noble gesto de devolver este cuaderno, ya que con ello estará ayudando a otras personas. 17 de mayo de 2019 Se realizó una visita a Centrum Transgenia, una empresa dedicada a la innovación tecnológica a través de la Industria 4.0. Es una empresa que usa la ciencia de datos para las empresas. Actividad 1. Llegué temprano, a las 9:45 a las oficinas de Centrum Transgenia, ubicadas en Camelia 94, Ecatepec de Morelos, Estado de México, México. Actividad 2. Me recibió una señorita en recepción, la cuál me solicitó una identificación oficial para darme una credencial que me llevó al piso de Transgenia Actividad 3. A las 10:00 me recibió la recepcionista de la empresa, la cuál se comunicó con la Lic. Noemí L, encargada de ventas. Nos presentamos y le recordé el objetivo de la visita y con una sonrisa accedió amablemente a darme un recorrido por las oficinas. 30
  • 31. Actividad 4. a las 10:10 comenzamos el recorrido, obviamos la recepción y la sala de juntas, que es en donde me recibió y me permitió dejar el resto de mis cosas. Actividad 5. Pasamos al área administrativa, que es la más pequeña de toda la empresa. Ahí había 3 personas trabajando en la contabilidad de la empresa. Actividad 6. Seguimos al área de innovación tecnológica, básicamente es un departamento con una sola mesa grande al centro, y lugares asignados para las personas que trabajan ahí. Son todos ingenieros de diferentes carreras que se coordinan para solucionar diferentes solicitudes. Trabajan en Internet de las Cosas, Análisis de sentimientos, robótica adaptativa, Tecnologías de virtualización, Sensores y muchas otras cosas que tienen que ver con innovación. Actividad 7. Fuimos al área de ciencia de datos, ésta área es más callada. Son ingenieros también, pero cada uno tiene un cubículo. Ellos son personas que programan y analizan muchos datos a través de servidores en la nube. Actividad 8. Me presentaron al Dr. Julián V. director de área Data Science. Con él acordé una cita posterior ese mismo día para realizarle una entrevista acerca de la ciencia de datos y accedió sin problema. Actividad 9. Fui nuevamente por mis cosas, me despedí de la Lic Noemí L. y le agradecí inmensamente su ayuda. Actividad 10. Recogí mi credencial a la salida y avisé que volvería en unas horas. Parece que no le interesó. 31
  • 32. Actividades no realizadas En ése momento no pude realizar la entrevista debido a que el Dr. estaba atendiendo un tema con su equipo. Hallazgos importantes De la visita a la empresa, tuve la oportunidad de ver la manera en la que se trabaja como innovador tecnológico y la infraestructura de una empresa dedicada a la Industria 4.0. Conocí al Dr. Julián V. director y especialista en ciencias de datos. Impacto de la experiencia Con ésta investigación, se obtiene claridad con respecto al trabajo real de científicos de datos. Cómo y en dónde lo realizan. Además de la estructura e impacto que tienen en la sociedad. 32
  • 33. La entrevista ¿Qué es la ciencia de datos? ¿Cuál es su importancia? ¿Qué materias se relacionan con la ciencia de datos? ¿Cuál es la necesidad en la industria de la ciencia de datos? ¿Que se necesita estudiar para ser un científico de datos? ¿Cuánto tiempo se tarda uno para ser científico de datos? Una pregunta muy personal, ¿Es tarde para mi formarme en la ciencia de datos? Comentarios finales La encuesta La siguiente encuesta está dirigida a profesionistas y universitarios con el fin de identificar la relación  de la ciencia de datos con las diferentes áreas de conocimiento.  Demográficos Las siguientes preguntas tienen la finalidad de segmentar los resultados. No se solicita ningún dato personal. Género Mujer Hombre Edad (Solo números) Nivel de estudios Universidad en curso o trunca Pasante Titulado Maestría Doctorado Técnico Superior Universitario Área de conocimientos 33
  • 34. Agronomía veterinaria y afines Bellas artes Ciencias de la educación Ciencias de la salud Ciencias sociales y humanas Economía, administración, contaduría y afines Ingeniería, arquitectura, urbanismo y afines Matemáticas y ciencias naturales Estado Aguascalientes Baja California Baja California Sur Campeche Coahuila Colima Chiapas Chihuahua Ciudad de México Durango Guanajuato Guerrero Hidalgo Jalisco Estado de México Michoacán Morelos Nayarit Nuevo León Oaxaca Puebla Querétaro Quintana Roo San Luis Potosí Sinaloa Sonora Tabasco Tamaulipas Tlaxcala Veracruz Yucatán Zacatecas 34
  • 35. La ciencia de datos En ésta sección realizaremos preguntas acerca de la relación que tienes con la ciencia de datos o las áreas que la integran. ¿Haz escuchado el término Ciencia de Datos o Data Science? Sí No Tal vez En tu profesión ¿Se manejan muchos datos? Sí No Tal vez ¿Cuál es el método más común para procesar, mostrar y ordenar los datos? Estadística Excel Un programa informático Presentaciones en Power Point o similar Registro en hojas Registro de datos en archivos ¿Cuál es la importancia de cada una de las siguientes materias con relación a la ciencia de datos? Nada importante Poco importante Regularmente importante Muy importante Imprescindible Matemáticas Estadística Literatura Procesamiento de lenguaje natural Computación Artes Programación Bases de datos Minería de datos Música Derecho Biología 35
  • 36. Mercadotecnia Aprendizaje automático Modelado matemático Medicina Analítica predictiva Economía Econometría Probabilidad Psicología Producción audiovisual Matemáticas Estadística Literatura Procesamiento de lenguaje natural Computación Artes Programación Bases de datos Minería de datos Música Derecho Biología Mercadotecnia Aprendizaje automático Modelado matemático Medicina Analítica predictiva Economía Econometría Probabilidad Psicología Producción audiovisual Selecciona el área de conocimientos que consideres que tiene la mayor importancia para la ciencia de datos Matemáticas Estadística Literatura Procesamiento de lenguaje natural Computación Artes Programación Bases de datos Minería de datos Música 36
  • 37. Derecho Biología Mercadotecnia Aprendizaje automático Modelado matemático Medicina Analítica predictiva Economía Econometría Probabilidad Psicología Producción audiovisua ¿Qué tan importante consideras que es la ciencia de datos con relación a tu profesión? Nada importante 1 2 3 4 5 Muy importante 37
  • 38. ¿En qué se podría usar la ciencia de datos en tu profesión? Experimentación Seguimiento de pacientes Modelado de comportamientos Predicción de compras/ventas Procesamiento de muchos datos Análisis automático Ordenamiento automático ¿Qué tan importante consideras la creación de nuevas carreras especializadas en ciencia de datos? Nada importante 1 2 3 4 5 Muy importante ¿Cuántas horas al día ves la tv? 0 a 2 3 a 5 5 a 8 Más de 8 horas ¿Te interesaría conocer más acerca de éste tema? Sí No Tal vez ¡Te invito a visitar mi blog! Puedes conocer más acerca de ésta investigación entrando a​ https://jadwer.wordpress.com/ Agradecemos tu participación, ésta encuesta es importante para la investigación. 38