SlideShare una empresa de Scribd logo
1 de 43
Descargar para leer sin conexión
INTRODUCCIÓN AL MACHINE
LEARNING
Preparado como parte de las Actividades por el LII Aniversario de la
Facultad de Ciencias Puras y Naturales
M.Sc. Aldo Ramiro Valdez Alvarado
Mayo de 2018
Inteligencia Artificial y ML
Big Data y ML
Data Science y ML
Definición de ML
Tipos de ML
Aprendizaje Supervisado
Aprendizaje No Supervisado
Índice
1
2
3
4
5
6
7
Google Trends…
Inteligencia Artificial y ML1
La Inteligencia Artificial es la ciencia de construir
máquinas que…
… piensen
como humanos
… actúen como
humanos
… piensen
racionalmente
… actúen
racionalmente
En 1959, el científico de la IBM
Arthur Samuel escribió un
programa para jugar damas, para
mejorarlo hizo que el programa
jugara consigo mismo miles de
veces, el programa era capaz de
mejorar su rendimiento a través
de la experiencia, el programa
aprendió y nació el Machine
Learning.
Big Data y ML2
• Actualmente existen almacenados
+2.7 Zetabytes, se esperan 35
Zetabytes para 2020
• En 2012 la información digital
alcanzó a nivel mundial 2.837
exabytes. Puestos en DVDs, la
torre sería de 400.000 Kms, más
que la distancia de la Tierra a la
Luna
• Google procesa más de 24
Petabytes/día, información
equivalente a varios miles de veces
la biblioteca del congreso de USA
Crecimiento
exponencial
de datos
Frecuencia
a la que se
genera los
datos
Diferentes
formatos y
estructuras
de los datos
Exactitud
de los datos
y del
cálculo
Data Science y ML3
La ciencia de datos (Data Science) es la ciencia
computacional de la extracción de conocimientos
significativos a partir de datos brutos y luego la comunicación
efectiva de esos conocimientos para generar valor. (Pierson,
2017)
Definición de ML4
El aprendizaje automático o
Machine Learning es un método
científico que nos permite usar
los ordenadores y otros
dispositivos con capacidad
computacional para que
aprendan a extraer los patrones
y relaciones que hay en nuestros
datos por sí solos. Esos patrones
se pueden usar luego para
predecir comportamientos y en
la toma de decisiones.
El Aprendizaje Automático es un campo en la
Inteligencia Artificial, donde las máquinas pueden
"aprender" de sí mismas, sin ser explícitamente
programadas por los seres humanos. Analizando datos
pasados llamados "datos de entrenamiento", el modelo
de Aprendizaje Automático forma patrones y usa estos
patrones para aprender y hacer predicciones futuras.
"Se dice que un programa de computadora
aprende de la experiencia E con respecto a alguna
clase de tareas T y la medida de rendimiento P, si
su rendimiento en tareas en T, medido por P,
mejora con la experiencia E. “
Mitchell, 1997
Machine
Learning
Estadística
Visualización
Economía
Bases de
Datos
Procesamien
to de
Señales
Ingeniería
Biología
Tipos de ML5
Aprendizaje
Supervisado
• Modelos
Predictivos.
• La máquina
aprende
explícitamente.
• Predice el futuro a
partir de datos
históricos.
• Resuelve
problemas de
clasificación y
regresión.
Aprendizaje No
Supervisado
• Modelos
Descriptivos.
• La máquina
entiende los datos.
• La evaluación es
cualitativa o
indirecta.
• No realiza
predicciones,
encuentra algo
específico.
Aprendizaje
Reforzado
• Un enfoque de la IA
• Aprendizaje basado
en los hallazgos.
• La máquina
aprende a como
actuar en un
determinado
entorno.
• Maximiza los
hallazgos.
Variables Discretas
Aprendizaje Supervisado Aprendizaje No Supervisado
Variables Continúas
Clasificación Clustering
Regresión
Reducción de la
Dimensión
6 Aprendizaje Supervisado
Aprendiendo un modelo, de datos etiquetados.
Datos de Entrenamiento: “ejemplos” x con “etiquetas” y.
(x1, y1), . . . , (xn, yn) / xi ∈ Rd
Clasificación: y es discreta.Para simplificar, y ∈ {−1, +1}
f : Rd −→ {−1, +1} f es llamada un clasificador binario.
Ejemplo: Aprobación de créditos si/no, spam/ham,
banana/naranja.
Característica2
Característica 1
Característica2
Característica 1
Límite de la decisión
Característica2
Característica 1
Límite de la decisión
Algoritmos: SVM, árboles de decisión, redes neuronales,
K – nearest neighbors, naive bayes, entre otros.
Clasificación
Clasificación no lineal
Datos de Entrenamiento:“ejemplos” x con “etiquetas” y.
(x1, y1), . . . , (xn, yn) / xi ∈ Rd
Regresión: y es un valor real, y ∈ R
f : Rd → R f es llamado un regresor.
Ejemplo: cantidad de crédito, peso de una fruta.
7 Aprendizaje No Supervisado
Aprendiendo un modelo, de datos no etiquetados.
Datos de Entrenamiento: “ejemplos” x.
x1, . . . , xn, xi ∈X ⊂ Rn
Clustering/segmentation:
f : Rd −→ {C1, . . . Ck} (Conjunto de clusters).
Ejemplo: Encontrar clusters en la población, frutas, especies.
Característica2
Característica 1
Característica2
Característica 1
Característica2
Característica 1
Algoritmos: K-means, gaussian mixtures, clustering jerárquico,
spectral clustering, entre otros.
Aldo Ramiro Valdez Alvarado
Licenciado en Informática
Máster en Dirección Estrategica en Tecnologías de la Información
Máster(c) en Business Intelligence y Big Data
Docente Titular de la Carrera de Informática de la UMSA
Docente de Postgrado en la UMSA y otras Universidades
Ex - Coordinador del Postgrado en Informática UMSA
Conferencista Nacional e Internacional
http://aldovaldezalvarado.blogspot.com/
https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820
arvaldez@umsa.bo
aldo_valdez@hotmail.com

Más contenido relacionado

La actualidad más candente

Support Vector Machines
Support Vector MachinesSupport Vector Machines
Support Vector Machines
nextlib
 

La actualidad más candente (20)

Machine learning overview
Machine learning overviewMachine learning overview
Machine learning overview
 
Support Vector Machines
Support Vector MachinesSupport Vector Machines
Support Vector Machines
 
Introduction to machine learning
Introduction to machine learningIntroduction to machine learning
Introduction to machine learning
 
Support Vector Machine and Implementation using Weka
Support Vector Machine and Implementation using WekaSupport Vector Machine and Implementation using Weka
Support Vector Machine and Implementation using Weka
 
Data preprocessing
Data preprocessingData preprocessing
Data preprocessing
 
Anomaly detection
Anomaly detectionAnomaly detection
Anomaly detection
 
Deep learning - Conceptual understanding and applications
Deep learning - Conceptual understanding and applicationsDeep learning - Conceptual understanding and applications
Deep learning - Conceptual understanding and applications
 
Introduction to Natural Language Processing (NLP)
Introduction to Natural Language Processing (NLP)Introduction to Natural Language Processing (NLP)
Introduction to Natural Language Processing (NLP)
 
Introduction to pattern recognition
Introduction to pattern recognitionIntroduction to pattern recognition
Introduction to pattern recognition
 
Lecture1 introduction to machine learning
Lecture1 introduction to machine learningLecture1 introduction to machine learning
Lecture1 introduction to machine learning
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learning
 
Machine learning: presentación
Machine learning: presentaciónMachine learning: presentación
Machine learning: presentación
 
Techniques in Deep Learning
Techniques in Deep LearningTechniques in Deep Learning
Techniques in Deep Learning
 
Introduction to Generative Adversarial Networks (GANs)
Introduction to Generative Adversarial Networks (GANs)Introduction to Generative Adversarial Networks (GANs)
Introduction to Generative Adversarial Networks (GANs)
 
Introduction to Machine Learning Classifiers
Introduction to Machine Learning ClassifiersIntroduction to Machine Learning Classifiers
Introduction to Machine Learning Classifiers
 
Machine learning
Machine learningMachine learning
Machine learning
 
"An Introduction to Machine Learning and How to Teach Machines to See," a Pre...
"An Introduction to Machine Learning and How to Teach Machines to See," a Pre..."An Introduction to Machine Learning and How to Teach Machines to See," a Pre...
"An Introduction to Machine Learning and How to Teach Machines to See," a Pre...
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
 
Anomaly Detection Using Isolation Forests
Anomaly Detection Using Isolation ForestsAnomaly Detection Using Isolation Forests
Anomaly Detection Using Isolation Forests
 
Machine learning introduction
Machine learning introductionMachine learning introduction
Machine learning introduction
 

Similar a Introducción al ML

slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
elianatorales
 
Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10
CAESCG.org
 

Similar a Introducción al ML (20)

Introducción a machine learning
Introducción a machine learningIntroducción a machine learning
Introducción a machine learning
 
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
 
Qué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdfQué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdf
 
Machine learning
Machine learningMachine learning
Machine learning
 
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIALFUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
 
Matemática y Data Science
Matemática y Data ScienceMatemática y Data Science
Matemática y Data Science
 
Las batallas del data scientist
Las batallas del data scientistLas batallas del data scientist
Las batallas del data scientist
 
Presentación Inteligencia Artificial.pptx
Presentación Inteligencia Artificial.pptxPresentación Inteligencia Artificial.pptx
Presentación Inteligencia Artificial.pptx
 
Inteligencia Artificial
Inteligencia Artificial Inteligencia Artificial
Inteligencia Artificial
 
Machine learning
Machine learningMachine learning
Machine learning
 
Machine Learning a lo berserker - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016Machine Learning a lo berserker  - Software Craftsmanship Barcelona 2016
Machine Learning a lo berserker - Software Craftsmanship Barcelona 2016
 
2010-10-15 (upm) eMadrid arcarrio uc3m algoritmos aprendizaje patrones
2010-10-15 (upm) eMadrid arcarrio uc3m algoritmos aprendizaje patrones2010-10-15 (upm) eMadrid arcarrio uc3m algoritmos aprendizaje patrones
2010-10-15 (upm) eMadrid arcarrio uc3m algoritmos aprendizaje patrones
 
Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Machine learning for business
Machine learning for businessMachine learning for business
Machine learning for business
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Inteligencia artificial y las redes neuronales
Inteligencia artificial y las redes neuronalesInteligencia artificial y las redes neuronales
Inteligencia artificial y las redes neuronales
 

Más de MSc Aldo Valdez Alvarado

Más de MSc Aldo Valdez Alvarado (20)

Introducción a la Ciberseguridad
Introducción a la CiberseguridadIntroducción a la Ciberseguridad
Introducción a la Ciberseguridad
 
3. Modelo ER - Relacional
3. Modelo ER - Relacional3. Modelo ER - Relacional
3. Modelo ER - Relacional
 
2. Modelo ER - Relacional
2. Modelo ER - Relacional2. Modelo ER - Relacional
2. Modelo ER - Relacional
 
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
 
Algunas aplicaciones del Blockchain
Algunas aplicaciones del BlockchainAlgunas aplicaciones del Blockchain
Algunas aplicaciones del Blockchain
 
El Blockchain más allá del Bitcoin
El Blockchain más allá del BitcoinEl Blockchain más allá del Bitcoin
El Blockchain más allá del Bitcoin
 
5. SQL
5. SQL5. SQL
5. SQL
 
Python con Anaconda
Python con AnacondaPython con Anaconda
Python con Anaconda
 
3. Modelo Relacional
3. Modelo Relacional3. Modelo Relacional
3. Modelo Relacional
 
Plataformas IoT Open Source
Plataformas IoT Open SourcePlataformas IoT Open Source
Plataformas IoT Open Source
 
2. Modelo ER
2. Modelo ER2. Modelo ER
2. Modelo ER
 
1. Modelo de Datos
1. Modelo de Datos1. Modelo de Datos
1. Modelo de Datos
 
6. Procesos de Cierre
6. Procesos de Cierre6. Procesos de Cierre
6. Procesos de Cierre
 
5. Procesos de Monitoreo y Control
5. Procesos de Monitoreo y Control5. Procesos de Monitoreo y Control
5. Procesos de Monitoreo y Control
 
4. Procesos de Ejecución
4. Procesos de Ejecución4. Procesos de Ejecución
4. Procesos de Ejecución
 
3. Procesos de Planificación (2)
3. Procesos de Planificación (2)3. Procesos de Planificación (2)
3. Procesos de Planificación (2)
 
3. Procesos de Planificación (1)
3. Procesos de Planificación (1)3. Procesos de Planificación (1)
3. Procesos de Planificación (1)
 
2. Procesos de Inicio
2. Procesos de Inicio2. Procesos de Inicio
2. Procesos de Inicio
 
1. Introducción y Marco Conceptual
1. Introducción y Marco Conceptual1. Introducción y Marco Conceptual
1. Introducción y Marco Conceptual
 
Educa innova
Educa innovaEduca innova
Educa innova
 

Último

Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Francisco158360
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
EliaHernndez7
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
RigoTito
 

Último (20)

SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIAFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
 
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 

Introducción al ML

  • 1. INTRODUCCIÓN AL MACHINE LEARNING Preparado como parte de las Actividades por el LII Aniversario de la Facultad de Ciencias Puras y Naturales M.Sc. Aldo Ramiro Valdez Alvarado Mayo de 2018
  • 2. Inteligencia Artificial y ML Big Data y ML Data Science y ML Definición de ML Tipos de ML Aprendizaje Supervisado Aprendizaje No Supervisado Índice 1 2 3 4 5 6 7
  • 5. La Inteligencia Artificial es la ciencia de construir máquinas que… … piensen como humanos … actúen como humanos … piensen racionalmente … actúen racionalmente
  • 6.
  • 7. En 1959, el científico de la IBM Arthur Samuel escribió un programa para jugar damas, para mejorarlo hizo que el programa jugara consigo mismo miles de veces, el programa era capaz de mejorar su rendimiento a través de la experiencia, el programa aprendió y nació el Machine Learning.
  • 9.
  • 10. • Actualmente existen almacenados +2.7 Zetabytes, se esperan 35 Zetabytes para 2020 • En 2012 la información digital alcanzó a nivel mundial 2.837 exabytes. Puestos en DVDs, la torre sería de 400.000 Kms, más que la distancia de la Tierra a la Luna • Google procesa más de 24 Petabytes/día, información equivalente a varios miles de veces la biblioteca del congreso de USA
  • 11. Crecimiento exponencial de datos Frecuencia a la que se genera los datos Diferentes formatos y estructuras de los datos Exactitud de los datos y del cálculo
  • 13. La ciencia de datos (Data Science) es la ciencia computacional de la extracción de conocimientos significativos a partir de datos brutos y luego la comunicación efectiva de esos conocimientos para generar valor. (Pierson, 2017)
  • 14.
  • 15.
  • 16.
  • 18. El aprendizaje automático o Machine Learning es un método científico que nos permite usar los ordenadores y otros dispositivos con capacidad computacional para que aprendan a extraer los patrones y relaciones que hay en nuestros datos por sí solos. Esos patrones se pueden usar luego para predecir comportamientos y en la toma de decisiones.
  • 19. El Aprendizaje Automático es un campo en la Inteligencia Artificial, donde las máquinas pueden "aprender" de sí mismas, sin ser explícitamente programadas por los seres humanos. Analizando datos pasados llamados "datos de entrenamiento", el modelo de Aprendizaje Automático forma patrones y usa estos patrones para aprender y hacer predicciones futuras.
  • 20. "Se dice que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y la medida de rendimiento P, si su rendimiento en tareas en T, medido por P, mejora con la experiencia E. “ Mitchell, 1997
  • 23. Aprendizaje Supervisado • Modelos Predictivos. • La máquina aprende explícitamente. • Predice el futuro a partir de datos históricos. • Resuelve problemas de clasificación y regresión. Aprendizaje No Supervisado • Modelos Descriptivos. • La máquina entiende los datos. • La evaluación es cualitativa o indirecta. • No realiza predicciones, encuentra algo específico. Aprendizaje Reforzado • Un enfoque de la IA • Aprendizaje basado en los hallazgos. • La máquina aprende a como actuar en un determinado entorno. • Maximiza los hallazgos.
  • 24. Variables Discretas Aprendizaje Supervisado Aprendizaje No Supervisado Variables Continúas Clasificación Clustering Regresión Reducción de la Dimensión
  • 25.
  • 27. Aprendiendo un modelo, de datos etiquetados. Datos de Entrenamiento: “ejemplos” x con “etiquetas” y. (x1, y1), . . . , (xn, yn) / xi ∈ Rd Clasificación: y es discreta.Para simplificar, y ∈ {−1, +1} f : Rd −→ {−1, +1} f es llamada un clasificador binario. Ejemplo: Aprobación de créditos si/no, spam/ham, banana/naranja.
  • 30. Característica2 Característica 1 Límite de la decisión Algoritmos: SVM, árboles de decisión, redes neuronales, K – nearest neighbors, naive bayes, entre otros.
  • 33. Datos de Entrenamiento:“ejemplos” x con “etiquetas” y. (x1, y1), . . . , (xn, yn) / xi ∈ Rd Regresión: y es un valor real, y ∈ R f : Rd → R f es llamado un regresor. Ejemplo: cantidad de crédito, peso de una fruta.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38. 7 Aprendizaje No Supervisado
  • 39. Aprendiendo un modelo, de datos no etiquetados. Datos de Entrenamiento: “ejemplos” x. x1, . . . , xn, xi ∈X ⊂ Rn Clustering/segmentation: f : Rd −→ {C1, . . . Ck} (Conjunto de clusters). Ejemplo: Encontrar clusters en la población, frutas, especies.
  • 42. Característica2 Característica 1 Algoritmos: K-means, gaussian mixtures, clustering jerárquico, spectral clustering, entre otros.
  • 43. Aldo Ramiro Valdez Alvarado Licenciado en Informática Máster en Dirección Estrategica en Tecnologías de la Información Máster(c) en Business Intelligence y Big Data Docente Titular de la Carrera de Informática de la UMSA Docente de Postgrado en la UMSA y otras Universidades Ex - Coordinador del Postgrado en Informática UMSA Conferencista Nacional e Internacional http://aldovaldezalvarado.blogspot.com/ https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820 arvaldez@umsa.bo aldo_valdez@hotmail.com