SlideShare una empresa de Scribd logo
MATEMÁTICA Y DATA SCIENCE
Preparado como parte de las Actividades por el LI Aniversario de la Carrera
de Matemática
M.Sc. Aldo Ramiro Valdez Alvarado
Marzo de 2018
La Revolución de los Datos
Y llega el Big Data
Data Science: Una definición…
De la Minería de Datos al Machine Learning
El Proceso de Data Science
Herramientas más importantes
Índice
1
2
3
4
5
6
La Revolución de los Datos1
El proyecto del Genoma Humano
http://www.sdss.org/
El proyecto Sloan Digital Sky Survey
IoT
Internet en 60 segundos
En 2007 solo el 7% de la
información estaba en
medios analógicos
(libros, revistas, fotografías
en papel, etc.)
En 2012 la información
digital alcanzó a nivel
mundial 2.837 exabytes
(miles de millones de
gigabytes). Puestos en
DVDs, la torre sería de
400.000 Kms, más que la
distancia de la Tierra a la
Luna.
Google procesa más de 24
Petabytes/día, información
equivalente a varios miles
de veces la biblioteca del
congreso de USA
Y llega el Big Data2
En el 2001, el analista Doug Laney de META Group (ahora
Gartner) utilizaba y definía el término Big Data como:
“el conjunto de técnicas y tecnologías para el tratamiento
de datos, en entornos de gran volumen, variedad de
orígenes y en los que la velocidad de respuesta es crítica”.
•Crecimiento exponencial.
•Terabytes, petabyte, …
Volumen
•Frecuencia de generación.
•Procesado en tiempo real.
Velocidad
•Diferentes formatos.
•Diferentes estructuras.
Variedad
IBM introdujo la cuarta V
Data Science: Una
definición…
3
• La ciencia de datos (Data Science) implica el uso de
métodos para analizar cantidades masivas de datos y
extraer el conocimiento que se contienen en estas.
• La ciencia de datos representa la optimización de
procesos y recursos.
• La ciencia de datos produce información valiosa:
conclusiones o predicciones procesables, basadas en
datos, que usted puede usar para comprender y mejorar
su negocio, sus inversiones, su salud e incluso su estilo de
vida y su vida social. (Cielen, 2016)
• La ciencia de datos (Data Science) es la ciencia
computacional de la extracción de conocimientos
significativos a partir de datos brutos y luego la
comunicación efectiva de esos conocimientos para
generar valor. (Pierson, 2017)
• En un mundo dirigido por los datos, la ciencia de datos
(Data Science) se puede definir como algo que los
cientistas de datos hacen. (Haider, 2016)
Un Científico de Datos (Data
Scientist) es una persona con
habilidades matemáticas,
estadísticas, computacionales
(que sabe programar) y de
visualización de datos que lo
llevan a encontrar los
patrones que le servirán a la
empresa o institución para
capitalizar la información
recogida. (Valdés, 2015)
Data Scientist
La ciencia de los datos se basa en gran medida en las
habilidades matemáticas y estadísticas de un
profesional, precisamente porque estas son las
habilidades necesarias para comprender sus datos y
su importancia. Estas habilidades pueden usarse para
llevar a cabo modelos predictivos, modelos de
decisiones y pruebas de hipótesis.
La matemática usa métodos determinísticos para
formar una descripción cuantitativa (o numérica) del
mundo; la estadística es una ciencia que se deriva de
las matemáticas, pero se centra en el uso de un
enfoque estocástico (probabilidades) y métodos
inferenciales para formar una descripción
cuantitativa del mundo.
Los científicos usan los métodos matemáticos para
construir modelos de decisión, generar
aproximaciones y hacer predicciones sobre el
futuro.
De la Minería de Datos al
Machine Learning
4
La minería de datos trata de resolver problemas
mediante el análisis de datos, mismos que ya están
presentes en las bases de datos.
Minería de datos
La minería de datos se define como el proceso de
descubrir patrones en los datos. El proceso debe ser
automático o semiautomático. Los patrones
descubiertos deben ser significativos ya que
conducen a alguna ventaja, generalmente una ventaja
económica. Los datos están invariablemente
presentes en cantidades sustanciales.
La minería de datos trata de técnicas para encontrar y
describir patrones estructurales en los datos. La
mayoría de las técnicas que se tienen se han
desarrollado dentro de un campo, conocido como
aprendizaje automático (Machine Learning).
Machine Learning
El Aprendizaje Automático es un campo en la
Inteligencia Artificial, donde las máquinas pueden
"aprender" de sí mismas, sin ser explícitamente
programadas por los seres humanos. Analizando datos
pasados llamados "datos de entrenamiento", el modelo
de Aprendizaje Automático forma patrones y usa estos
patrones para aprender y hacer predicciones futuras.
El aprendizaje automático o Machine Learning es un método
científico que nos permite usar los ordenadores y otros dispositivos
con capacidad computacional para que aprendan a extraer los
patrones y relaciones que hay en nuestros datos por sí solos. Esos
patrones se pueden usar luego para predecir comportamientos y
en la toma de decisiones.
Aprendizaje
Supervisado
• Modelos Predictivos.
• La máquina aprende
explícitamente.
• Predice el futuro a
partir de datos
históricos.
• Resuelve problemas
de clasificación y
regresión.
Aprendizaje No
Supervisado
• Modelos
Descriptivos.
• La máquina entiende
los datos.
• La evaluación es
cualitativa o
indirecta.
• No realiza
predicciones,
encuentra algo
específico.
Aprendizaje
Reforzado
• Un enfoque de la IA
• Aprendizaje basado
en los hallazgos.
• La máquina aprende
a como actuar en un
determinado
entorno.
• Maximiza los
hallazgos.
El Proceso de Data Science5
1. Establecer el objetivo de la investigación
2. Recuperar datos
3. Preparar datos
4. Explorar datos
5. Modelar datos
6. Presentar y automatizar
• Definir el objetivo de la investigación.
• Crear el cronograma del proyecto.
1. Establecer
Objetivo
• Para los datos internes, se determina
quién es el dueño y se los recupera.
• De igual forma para los datos externos.
2. Recuperar
Datos
• Limpiar los datos, de posibles errores en
la entrada de datos, de valores
físicamente imposibles, valores faltantes…
3. Preparar
Datos
• Transformar los datos, agregando o
extrapolando datos, reduciendo el número
de variables.
• Combinar los datos, mezclando conjuntos
de datos, creando vistas…
3.
Preparar
Datos
• A través de simples gráficas, gráficas
combinadas, o de otras técnicas que no
sean gráficas.
4.
Explorar
Datos
• Seleccionar las variables y el modelo.
• Ejecutar el modelo.
• Realizar el diagnóstico y la
comparación.
5. Modelar
Datos
• Presentar los datos.
• Automatizar el análisis de datos.
6. Presentar
y
Automatizar
Herramientas más
importantes
6
Aldo Ramiro Valdez Alvarado
Licenciado en Informática
Master en Dirección Estrategica en Tecnologías de la Información
Máster en Business Intelligence y Big Data
Docente Titular de Pregrado en la UMSA
Docente de Postgrado en la UMSA y otras Universidades
Ex - Coordinador del Postgrado en Informática UMSA
Conferencista Nacional e Internacional
http://aldovaldezalvarado.blogspot.com/
https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820
aldo_valdez@hotmail.com

Más contenido relacionado

Similar a Matemática y Data Science

1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx
RupertoCisneros3
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
LuisAzofeifa6
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
Ricardo Lopez-Ruiz
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
PabloMolina111
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
mariselalabrador2006
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Yolanda Uruchima
 
introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------
RubnGarcs2
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
renfer64
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
María Inés Cahuana Lázaro
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
VictoriaEspinoza31
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
Armando Romani
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Diana Rubiano
 
Fases y tareas del proceso de investigacion de informacion. Mercadotecnia
Fases y tareas del proceso de investigacion de informacion. MercadotecniaFases y tareas del proceso de investigacion de informacion. Mercadotecnia
Fases y tareas del proceso de investigacion de informacion. Mercadotecnia
BeatrizLilianaCarrera
 
Etapas del proceso de investigacion2_IAFJSR
Etapas del proceso de investigacion2_IAFJSREtapas del proceso de investigacion2_IAFJSR
Etapas del proceso de investigacion2_IAFJSR
Mauri Rojas
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Data Science: Correlación curricular
Data Science: Correlación curricularData Science: Correlación curricular
Data Science: Correlación curricular
Rodrigo Gabino Ramírez Moreno
 
Data mining
Data miningData mining
Data mining
Dayana Ortega
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
Sergio Salimbeni
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
CarlosCastro72554
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
Adrian Barrientos
 

Similar a Matemática y Data Science (20)

1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Fases y tareas del proceso de investigacion de informacion. Mercadotecnia
Fases y tareas del proceso de investigacion de informacion. MercadotecniaFases y tareas del proceso de investigacion de informacion. Mercadotecnia
Fases y tareas del proceso de investigacion de informacion. Mercadotecnia
 
Etapas del proceso de investigacion2_IAFJSR
Etapas del proceso de investigacion2_IAFJSREtapas del proceso de investigacion2_IAFJSR
Etapas del proceso de investigacion2_IAFJSR
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data Science: Correlación curricular
Data Science: Correlación curricularData Science: Correlación curricular
Data Science: Correlación curricular
 
Data mining
Data miningData mining
Data mining
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 

Más de MSc Aldo Valdez Alvarado

Introducción a la Ciberseguridad
Introducción a la CiberseguridadIntroducción a la Ciberseguridad
Introducción a la Ciberseguridad
MSc Aldo Valdez Alvarado
 
3. Modelo ER - Relacional
3. Modelo ER - Relacional3. Modelo ER - Relacional
3. Modelo ER - Relacional
MSc Aldo Valdez Alvarado
 
2. Modelo ER - Relacional
2. Modelo ER - Relacional2. Modelo ER - Relacional
2. Modelo ER - Relacional
MSc Aldo Valdez Alvarado
 
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
MSc Aldo Valdez Alvarado
 
Algunas aplicaciones del Blockchain
Algunas aplicaciones del BlockchainAlgunas aplicaciones del Blockchain
Algunas aplicaciones del Blockchain
MSc Aldo Valdez Alvarado
 
El Blockchain más allá del Bitcoin
El Blockchain más allá del BitcoinEl Blockchain más allá del Bitcoin
El Blockchain más allá del Bitcoin
MSc Aldo Valdez Alvarado
 
5. SQL
5. SQL5. SQL
Python con Anaconda
Python con AnacondaPython con Anaconda
Python con Anaconda
MSc Aldo Valdez Alvarado
 
3. Modelo Relacional
3. Modelo Relacional3. Modelo Relacional
3. Modelo Relacional
MSc Aldo Valdez Alvarado
 
Plataformas IoT Open Source
Plataformas IoT Open SourcePlataformas IoT Open Source
Plataformas IoT Open Source
MSc Aldo Valdez Alvarado
 
2. Modelo ER
2. Modelo ER2. Modelo ER
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
MSc Aldo Valdez Alvarado
 
6. Procesos de Cierre
6. Procesos de Cierre6. Procesos de Cierre
6. Procesos de Cierre
MSc Aldo Valdez Alvarado
 
5. Procesos de Monitoreo y Control
5. Procesos de Monitoreo y Control5. Procesos de Monitoreo y Control
5. Procesos de Monitoreo y Control
MSc Aldo Valdez Alvarado
 
4. Procesos de Ejecución
4. Procesos de Ejecución4. Procesos de Ejecución
4. Procesos de Ejecución
MSc Aldo Valdez Alvarado
 
3. Procesos de Planificación (2)
3. Procesos de Planificación (2)3. Procesos de Planificación (2)
3. Procesos de Planificación (2)
MSc Aldo Valdez Alvarado
 
3. Procesos de Planificación (1)
3. Procesos de Planificación (1)3. Procesos de Planificación (1)
3. Procesos de Planificación (1)
MSc Aldo Valdez Alvarado
 
2. Procesos de Inicio
2. Procesos de Inicio2. Procesos de Inicio
2. Procesos de Inicio
MSc Aldo Valdez Alvarado
 
1. Introducción y Marco Conceptual
1. Introducción y Marco Conceptual1. Introducción y Marco Conceptual
1. Introducción y Marco Conceptual
MSc Aldo Valdez Alvarado
 
Educa innova
Educa innovaEduca innova

Más de MSc Aldo Valdez Alvarado (20)

Introducción a la Ciberseguridad
Introducción a la CiberseguridadIntroducción a la Ciberseguridad
Introducción a la Ciberseguridad
 
3. Modelo ER - Relacional
3. Modelo ER - Relacional3. Modelo ER - Relacional
3. Modelo ER - Relacional
 
2. Modelo ER - Relacional
2. Modelo ER - Relacional2. Modelo ER - Relacional
2. Modelo ER - Relacional
 
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
 
Algunas aplicaciones del Blockchain
Algunas aplicaciones del BlockchainAlgunas aplicaciones del Blockchain
Algunas aplicaciones del Blockchain
 
El Blockchain más allá del Bitcoin
El Blockchain más allá del BitcoinEl Blockchain más allá del Bitcoin
El Blockchain más allá del Bitcoin
 
5. SQL
5. SQL5. SQL
5. SQL
 
Python con Anaconda
Python con AnacondaPython con Anaconda
Python con Anaconda
 
3. Modelo Relacional
3. Modelo Relacional3. Modelo Relacional
3. Modelo Relacional
 
Plataformas IoT Open Source
Plataformas IoT Open SourcePlataformas IoT Open Source
Plataformas IoT Open Source
 
2. Modelo ER
2. Modelo ER2. Modelo ER
2. Modelo ER
 
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
 
6. Procesos de Cierre
6. Procesos de Cierre6. Procesos de Cierre
6. Procesos de Cierre
 
5. Procesos de Monitoreo y Control
5. Procesos de Monitoreo y Control5. Procesos de Monitoreo y Control
5. Procesos de Monitoreo y Control
 
4. Procesos de Ejecución
4. Procesos de Ejecución4. Procesos de Ejecución
4. Procesos de Ejecución
 
3. Procesos de Planificación (2)
3. Procesos de Planificación (2)3. Procesos de Planificación (2)
3. Procesos de Planificación (2)
 
3. Procesos de Planificación (1)
3. Procesos de Planificación (1)3. Procesos de Planificación (1)
3. Procesos de Planificación (1)
 
2. Procesos de Inicio
2. Procesos de Inicio2. Procesos de Inicio
2. Procesos de Inicio
 
1. Introducción y Marco Conceptual
1. Introducción y Marco Conceptual1. Introducción y Marco Conceptual
1. Introducción y Marco Conceptual
 
Educa innova
Educa innovaEduca innova
Educa innova
 

Último

Ejercicios propuestos (if , switch).docx
Ejercicios propuestos (if , switch).docxEjercicios propuestos (if , switch).docx
Ejercicios propuestos (if , switch).docx
sebastianjacome1808
 
Mi Comunidad en paijan peru visitalo ya..
Mi Comunidad en paijan peru visitalo ya..Mi Comunidad en paijan peru visitalo ya..
Mi Comunidad en paijan peru visitalo ya..
santi cachique
 
Los Recursos Naturales como Base de la Economía
Los Recursos Naturales como Base de la EconomíaLos Recursos Naturales como Base de la Economía
Los Recursos Naturales como Base de la Economía
JonathanCovena1
 
princupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdf
princupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdfprincupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdf
princupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdf
Elvis Bailón de la Cruz
 
FRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLA
FRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLAFRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLA
FRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLA
JAVIER SOLIS NOYOLA
 
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
MiNeyi1
 
Ensayo sobre José María Arguedas Peruanodocx
Ensayo sobre José María Arguedas PeruanodocxEnsayo sobre José María Arguedas Peruanodocx
Ensayo sobre José María Arguedas Peruanodocx
danelycacchavaldivia
 
Fundamentos filosóficos de la metodología de la enseñanza .pdf
Fundamentos filosóficos de la metodología de la enseñanza .pdfFundamentos filosóficos de la metodología de la enseñanza .pdf
Fundamentos filosóficos de la metodología de la enseñanza .pdf
AnaisMundaray
 
Calidad de vida laboral - Ética y Responsabilidad Social Empresarial
Calidad de vida laboral - Ética y Responsabilidad Social EmpresarialCalidad de vida laboral - Ética y Responsabilidad Social Empresarial
Calidad de vida laboral - Ética y Responsabilidad Social Empresarial
JonathanCovena1
 
Presentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdf
Presentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdfPresentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdf
Presentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdf
LuanaJaime1
 
ELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdf
ELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdfELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdf
ELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdf
DaliaAndrade1
 
La mujer del flujo de sangre, un pa.pptx
La mujer del flujo de sangre, un pa.pptxLa mujer del flujo de sangre, un pa.pptx
La mujer del flujo de sangre, un pa.pptx
francisconaranjofern1
 
Fundamentos metodología deenseñanza.pptx
Fundamentos metodología deenseñanza.pptxFundamentos metodología deenseñanza.pptx
Fundamentos metodología deenseñanza.pptx
pedro827vasquez
 
La filosofía presocrática y los filosofos más relvantes del periodo.
La filosofía presocrática y los filosofos más relvantes del periodo.La filosofía presocrática y los filosofos más relvantes del periodo.
La filosofía presocrática y los filosofos más relvantes del periodo.
DobbieElfo
 
Marketing responsable - Ética y Responsabilidad Social Empresarial
Marketing responsable - Ética y Responsabilidad Social EmpresarialMarketing responsable - Ética y Responsabilidad Social Empresarial
Marketing responsable - Ética y Responsabilidad Social Empresarial
JonathanCovena1
 
Mapa-conceptual-de-la-Evolucion-del-Hombre-3.pptx
Mapa-conceptual-de-la-Evolucion-del-Hombre-3.pptxMapa-conceptual-de-la-Evolucion-del-Hombre-3.pptx
Mapa-conceptual-de-la-Evolucion-del-Hombre-3.pptx
ElizabethLpez634570
 
Clasificación de los animales vertebrados
Clasificación de los animales vertebradosClasificación de los animales vertebrados
Clasificación de los animales vertebrados
DianaLopez859290
 
contrato de trabajo en Honduras análisis
contrato de trabajo en Honduras análisiscontrato de trabajo en Honduras análisis
contrato de trabajo en Honduras análisis
vilmachavez2024
 
Elmer crizologo rojas.pdf aplicaciones en internet
Elmer crizologo rojas.pdf aplicaciones en internetElmer crizologo rojas.pdf aplicaciones en internet
Elmer crizologo rojas.pdf aplicaciones en internet
Elmer Crizologo Rojas
 
REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...
REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...
REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...
carla526481
 

Último (20)

Ejercicios propuestos (if , switch).docx
Ejercicios propuestos (if , switch).docxEjercicios propuestos (if , switch).docx
Ejercicios propuestos (if , switch).docx
 
Mi Comunidad en paijan peru visitalo ya..
Mi Comunidad en paijan peru visitalo ya..Mi Comunidad en paijan peru visitalo ya..
Mi Comunidad en paijan peru visitalo ya..
 
Los Recursos Naturales como Base de la Economía
Los Recursos Naturales como Base de la EconomíaLos Recursos Naturales como Base de la Economía
Los Recursos Naturales como Base de la Economía
 
princupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdf
princupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdfprincupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdf
princupalesplagasyenfermedadesdelpaltopdf-230717165119-fd68bcac.pdf
 
FRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLA
FRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLAFRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLA
FRASE CÉLEBRE OLÍMPICA EN ROMPECABEZAS. Por JAVIER SOLIS NOYOLA
 
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
1.- manual-para-la-creacion-33-dias-de-manifestacion-ulises-sampe.pdf
 
Ensayo sobre José María Arguedas Peruanodocx
Ensayo sobre José María Arguedas PeruanodocxEnsayo sobre José María Arguedas Peruanodocx
Ensayo sobre José María Arguedas Peruanodocx
 
Fundamentos filosóficos de la metodología de la enseñanza .pdf
Fundamentos filosóficos de la metodología de la enseñanza .pdfFundamentos filosóficos de la metodología de la enseñanza .pdf
Fundamentos filosóficos de la metodología de la enseñanza .pdf
 
Calidad de vida laboral - Ética y Responsabilidad Social Empresarial
Calidad de vida laboral - Ética y Responsabilidad Social EmpresarialCalidad de vida laboral - Ética y Responsabilidad Social Empresarial
Calidad de vida laboral - Ética y Responsabilidad Social Empresarial
 
Presentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdf
Presentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdfPresentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdf
Presentación Mi proyecto Final Femenino Delicado Rosa y Nude.pdf
 
ELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdf
ELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdfELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdf
ELEMENTOS DE LA COMPRENSION ORAL-ESCUCHA ACTIVA.pdf
 
La mujer del flujo de sangre, un pa.pptx
La mujer del flujo de sangre, un pa.pptxLa mujer del flujo de sangre, un pa.pptx
La mujer del flujo de sangre, un pa.pptx
 
Fundamentos metodología deenseñanza.pptx
Fundamentos metodología deenseñanza.pptxFundamentos metodología deenseñanza.pptx
Fundamentos metodología deenseñanza.pptx
 
La filosofía presocrática y los filosofos más relvantes del periodo.
La filosofía presocrática y los filosofos más relvantes del periodo.La filosofía presocrática y los filosofos más relvantes del periodo.
La filosofía presocrática y los filosofos más relvantes del periodo.
 
Marketing responsable - Ética y Responsabilidad Social Empresarial
Marketing responsable - Ética y Responsabilidad Social EmpresarialMarketing responsable - Ética y Responsabilidad Social Empresarial
Marketing responsable - Ética y Responsabilidad Social Empresarial
 
Mapa-conceptual-de-la-Evolucion-del-Hombre-3.pptx
Mapa-conceptual-de-la-Evolucion-del-Hombre-3.pptxMapa-conceptual-de-la-Evolucion-del-Hombre-3.pptx
Mapa-conceptual-de-la-Evolucion-del-Hombre-3.pptx
 
Clasificación de los animales vertebrados
Clasificación de los animales vertebradosClasificación de los animales vertebrados
Clasificación de los animales vertebrados
 
contrato de trabajo en Honduras análisis
contrato de trabajo en Honduras análisiscontrato de trabajo en Honduras análisis
contrato de trabajo en Honduras análisis
 
Elmer crizologo rojas.pdf aplicaciones en internet
Elmer crizologo rojas.pdf aplicaciones en internetElmer crizologo rojas.pdf aplicaciones en internet
Elmer crizologo rojas.pdf aplicaciones en internet
 
REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...
REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...
REGIMÉN ACADÉMICO PARA LA EDUCACIÓN SECUNDARIA - RESOC-2024-1650-GDEBA-DGC...
 

Matemática y Data Science

  • 1. MATEMÁTICA Y DATA SCIENCE Preparado como parte de las Actividades por el LI Aniversario de la Carrera de Matemática M.Sc. Aldo Ramiro Valdez Alvarado Marzo de 2018
  • 2. La Revolución de los Datos Y llega el Big Data Data Science: Una definición… De la Minería de Datos al Machine Learning El Proceso de Data Science Herramientas más importantes Índice 1 2 3 4 5 6
  • 3. La Revolución de los Datos1
  • 4. El proyecto del Genoma Humano
  • 6. IoT
  • 7. Internet en 60 segundos
  • 8. En 2007 solo el 7% de la información estaba en medios analógicos (libros, revistas, fotografías en papel, etc.)
  • 9. En 2012 la información digital alcanzó a nivel mundial 2.837 exabytes (miles de millones de gigabytes). Puestos en DVDs, la torre sería de 400.000 Kms, más que la distancia de la Tierra a la Luna.
  • 10. Google procesa más de 24 Petabytes/día, información equivalente a varios miles de veces la biblioteca del congreso de USA
  • 11. Y llega el Big Data2
  • 12. En el 2001, el analista Doug Laney de META Group (ahora Gartner) utilizaba y definía el término Big Data como: “el conjunto de técnicas y tecnologías para el tratamiento de datos, en entornos de gran volumen, variedad de orígenes y en los que la velocidad de respuesta es crítica”.
  • 13. •Crecimiento exponencial. •Terabytes, petabyte, … Volumen •Frecuencia de generación. •Procesado en tiempo real. Velocidad •Diferentes formatos. •Diferentes estructuras. Variedad
  • 14. IBM introdujo la cuarta V
  • 15.
  • 17. • La ciencia de datos (Data Science) implica el uso de métodos para analizar cantidades masivas de datos y extraer el conocimiento que se contienen en estas. • La ciencia de datos representa la optimización de procesos y recursos. • La ciencia de datos produce información valiosa: conclusiones o predicciones procesables, basadas en datos, que usted puede usar para comprender y mejorar su negocio, sus inversiones, su salud e incluso su estilo de vida y su vida social. (Cielen, 2016)
  • 18.
  • 19. • La ciencia de datos (Data Science) es la ciencia computacional de la extracción de conocimientos significativos a partir de datos brutos y luego la comunicación efectiva de esos conocimientos para generar valor. (Pierson, 2017) • En un mundo dirigido por los datos, la ciencia de datos (Data Science) se puede definir como algo que los cientistas de datos hacen. (Haider, 2016)
  • 20. Un Científico de Datos (Data Scientist) es una persona con habilidades matemáticas, estadísticas, computacionales (que sabe programar) y de visualización de datos que lo llevan a encontrar los patrones que le servirán a la empresa o institución para capitalizar la información recogida. (Valdés, 2015) Data Scientist
  • 21.
  • 22. La ciencia de los datos se basa en gran medida en las habilidades matemáticas y estadísticas de un profesional, precisamente porque estas son las habilidades necesarias para comprender sus datos y su importancia. Estas habilidades pueden usarse para llevar a cabo modelos predictivos, modelos de decisiones y pruebas de hipótesis.
  • 23. La matemática usa métodos determinísticos para formar una descripción cuantitativa (o numérica) del mundo; la estadística es una ciencia que se deriva de las matemáticas, pero se centra en el uso de un enfoque estocástico (probabilidades) y métodos inferenciales para formar una descripción cuantitativa del mundo.
  • 24. Los científicos usan los métodos matemáticos para construir modelos de decisión, generar aproximaciones y hacer predicciones sobre el futuro.
  • 25.
  • 26.
  • 27. De la Minería de Datos al Machine Learning 4
  • 28. La minería de datos trata de resolver problemas mediante el análisis de datos, mismos que ya están presentes en las bases de datos. Minería de datos
  • 29. La minería de datos se define como el proceso de descubrir patrones en los datos. El proceso debe ser automático o semiautomático. Los patrones descubiertos deben ser significativos ya que conducen a alguna ventaja, generalmente una ventaja económica. Los datos están invariablemente presentes en cantidades sustanciales.
  • 30. La minería de datos trata de técnicas para encontrar y describir patrones estructurales en los datos. La mayoría de las técnicas que se tienen se han desarrollado dentro de un campo, conocido como aprendizaje automático (Machine Learning).
  • 32. El Aprendizaje Automático es un campo en la Inteligencia Artificial, donde las máquinas pueden "aprender" de sí mismas, sin ser explícitamente programadas por los seres humanos. Analizando datos pasados llamados "datos de entrenamiento", el modelo de Aprendizaje Automático forma patrones y usa estos patrones para aprender y hacer predicciones futuras.
  • 33. El aprendizaje automático o Machine Learning es un método científico que nos permite usar los ordenadores y otros dispositivos con capacidad computacional para que aprendan a extraer los patrones y relaciones que hay en nuestros datos por sí solos. Esos patrones se pueden usar luego para predecir comportamientos y en la toma de decisiones.
  • 34. Aprendizaje Supervisado • Modelos Predictivos. • La máquina aprende explícitamente. • Predice el futuro a partir de datos históricos. • Resuelve problemas de clasificación y regresión. Aprendizaje No Supervisado • Modelos Descriptivos. • La máquina entiende los datos. • La evaluación es cualitativa o indirecta. • No realiza predicciones, encuentra algo específico. Aprendizaje Reforzado • Un enfoque de la IA • Aprendizaje basado en los hallazgos. • La máquina aprende a como actuar en un determinado entorno. • Maximiza los hallazgos.
  • 35. El Proceso de Data Science5
  • 36. 1. Establecer el objetivo de la investigación 2. Recuperar datos 3. Preparar datos 4. Explorar datos 5. Modelar datos 6. Presentar y automatizar
  • 37. • Definir el objetivo de la investigación. • Crear el cronograma del proyecto. 1. Establecer Objetivo • Para los datos internes, se determina quién es el dueño y se los recupera. • De igual forma para los datos externos. 2. Recuperar Datos • Limpiar los datos, de posibles errores en la entrada de datos, de valores físicamente imposibles, valores faltantes… 3. Preparar Datos
  • 38. • Transformar los datos, agregando o extrapolando datos, reduciendo el número de variables. • Combinar los datos, mezclando conjuntos de datos, creando vistas… 3. Preparar Datos • A través de simples gráficas, gráficas combinadas, o de otras técnicas que no sean gráficas. 4. Explorar Datos
  • 39. • Seleccionar las variables y el modelo. • Ejecutar el modelo. • Realizar el diagnóstico y la comparación. 5. Modelar Datos • Presentar los datos. • Automatizar el análisis de datos. 6. Presentar y Automatizar
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48. Aldo Ramiro Valdez Alvarado Licenciado en Informática Master en Dirección Estrategica en Tecnologías de la Información Máster en Business Intelligence y Big Data Docente Titular de Pregrado en la UMSA Docente de Postgrado en la UMSA y otras Universidades Ex - Coordinador del Postgrado en Informática UMSA Conferencista Nacional e Internacional http://aldovaldezalvarado.blogspot.com/ https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820 aldo_valdez@hotmail.com