Introducción al ML

INTRODUCCIÓN AL MACHINE
LEARNING
Preparado como parte de las Actividades por el LII Aniversario de la
Facultad de Ciencias Puras y Naturales
M.Sc. Aldo Ramiro Valdez Alvarado
Mayo de 2018

Inteligencia Artificial y ML
Big Data y ML
Data Science y ML
Definición de ML
Tipos de ML
Aprendizaje Supervisado
Aprendizaje No Supervisado
Índice
1
2
3
4
5
6
7

La Inteligencia Artificial es la ciencia de construir
máquinas que…
… piensen
como humanos
… actúen como
humanos
… piensen
racionalmente
… actúen
racionalmente

En 1959, el científico de la IBM
Arthur Samuel escribió un
programa para jugar damas, para
mejorarlo hizo que el programa
jugara consigo mismo miles de
veces, el programa era capaz de
mejorar su rendimiento a través
de la experiencia, el programa
aprendió y nació el Machine
Learning.

• Actualmente existen almacenados
+2.7 Zetabytes, se esperan 35
Zetabytes para 2020
• En 2012 la información digital
alcanzó a nivel mundial 2.837
exabytes. Puestos en DVDs, la
torre sería de 400.000 Kms, más
que la distancia de la Tierra a la
Luna
• Google procesa más de 24
Petabytes/día, información
equivalente a varios miles de veces
la biblioteca del congreso de USA

Crecimiento
exponencial
de datos
Frecuencia
a la que se
genera los
datos
Diferentes
formatos y
estructuras
de los datos
Exactitud
de los datos
y del
cálculo

La ciencia de datos (Data Science) es la ciencia
computacional de la extracción de conocimientos
significativos a partir de datos brutos y luego la comunicación
efectiva de esos conocimientos para generar valor. (Pierson,
2017)

El aprendizaje automático o
Machine Learning es un método
científico que nos permite usar
los ordenadores y otros
dispositivos con capacidad
computacional para que
aprendan a extraer los patrones
y relaciones que hay en nuestros
datos por sí solos. Esos patrones
se pueden usar luego para
predecir comportamientos y en
la toma de decisiones.

El Aprendizaje Automático es un campo en la
Inteligencia Artificial, donde las máquinas pueden
"aprender" de sí mismas, sin ser explícitamente
programadas por los seres humanos. Analizando datos
pasados llamados "datos de entrenamiento", el modelo
de Aprendizaje Automático forma patrones y usa estos
patrones para aprender y hacer predicciones futuras.

"Se dice que un programa de computadora
aprende de la experiencia E con respecto a alguna
clase de tareas T y la medida de rendimiento P, si
su rendimiento en tareas en T, medido por P,
mejora con la experiencia E. “
Mitchell, 1997

Machine
Learning
Estadística
Visualización
Economía
Bases de
Datos
Procesamien
to de
Señales
Ingeniería
Biología

Aprendizaje
Supervisado
• Modelos
Predictivos.
• La máquina
aprende
explícitamente.
• Predice el futuro a
partir de datos
históricos.
• Resuelve
problemas de
clasificación y
regresión.
Aprendizaje No
Supervisado
• Modelos
Descriptivos.
• La máquina
entiende los datos.
• La evaluación es
cualitativa o
indirecta.
• No realiza
predicciones,
encuentra algo
específico.
Aprendizaje
Reforzado
• Un enfoque de la IA
• Aprendizaje basado
en los hallazgos.
• La máquina
aprende a como
actuar en un
determinado
entorno.
• Maximiza los
hallazgos.

Variables Discretas
Aprendizaje Supervisado Aprendizaje No Supervisado
Variables Continúas
Clasificación Clustering
Regresión
Reducción de la
Dimensión

Aprendiendo un modelo, de datos etiquetados.
Datos de Entrenamiento: “ejemplos” x con “etiquetas” y.
(x1, y1), . . . , (xn, yn) / xi ∈ Rd
Clasificación: y es discreta.Para simplificar, y ∈ {−1, +1}
f : Rd −→ {−1, +1} f es llamada un clasificador binario.
Ejemplo: Aprobación de créditos si/no, spam/ham,
banana/naranja.

Característica2
Característica 1

Característica2
Característica 1
Límite de la decisión

Característica2
Característica 1
Límite de la decisión
Algoritmos: SVM, árboles de decisión, redes neuronales,
K – nearest neighbors, naive bayes, entre otros.

Datos de Entrenamiento:“ejemplos” x con “etiquetas” y.
(x1, y1), . . . , (xn, yn) / xi ∈ Rd
Regresión: y es un valor real, y ∈ R
f : Rd → R f es llamado un regresor.
Ejemplo: cantidad de crédito, peso de una fruta.

Aprendiendo un modelo, de datos no etiquetados.
Datos de Entrenamiento: “ejemplos” x.
x1, . . . , xn, xi ∈X ⊂ Rn
Clustering/segmentation:
f : Rd −→ {C1, . . . Ck} (Conjunto de clusters).
Ejemplo: Encontrar clusters en la población, frutas, especies.

Característica2
Característica 1
Algoritmos: K-means, gaussian mixtures, clustering jerárquico,
spectral clustering, entre otros.

Aldo Ramiro Valdez Alvarado
Licenciado en Informática
Máster en Dirección Estrategica en Tecnologías de la Información
Máster(c) en Business Intelligence y Big Data
Docente Titular de la Carrera de Informática de la UMSA
Docente de Postgrado en la UMSA y otras Universidades
Ex - Coordinador del Postgrado en Informática UMSA
Conferencista Nacional e Internacional
http://aldovaldezalvarado.blogspot.com/
https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820
arvaldez@umsa.bo
aldo_valdez@hotmail.com

Introducción al ML

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Introducción al ML

Similar a Introducción al ML (20)

Más de MSc Aldo Valdez Alvarado

Más de MSc Aldo Valdez Alvarado (20)

Último

Último (20)

Introducción al ML