Machine
Learning
Definición del ML
Tipos de Aprendizaje Automático
Aprendizaje Supervisado
Aprendizaje No Supervisado
Aprendizaje Reforzado
Software de ML
Ecosistema del ML
Índice
1
2
3
4
5
6
7
Google Trends…
Definición del ML
1
En 1959, el científico de la
IBM Arthur Samuel escribió
un programa para jugar
damas, para mejorarlo hizo
que el programa jugara
consigo mismo miles de
veces, el programa era capaz
de mejorar su rendimiento a
través de la experiencia, el
programa aprendió y nació el
Machine Learning.
El aprendizaje automático o
Machine Learning es un
método científico que nos
permite usar los ordenadores
y otros dispositivos con
capacidad computacional
para que aprendan a extraer
los patrones y relaciones que
hay en nuestros datos por sí
solos. Esos patrones se
pueden usar luego para
predecir comportamientos
y en la toma de decisiones.
El Aprendizaje Automático es un
campo en la Inteligencia Artificial,
donde las máquinas pueden
"aprender" de sí mismas, sin ser
explícitamente programadas por
los seres humanos. Analizando
datos pasados llamados "datos de
entrenamiento", el modelo de
Aprendizaje Automático forma
patrones y usa estos patrones
para aprender y hacer
predicciones futuras.
"Se dice que un programa de computadora
aprende de la experiencia E con respecto a
alguna clase de tareas T y la medida de
rendimiento P, si su rendimiento en tareas en
T, medido por P, mejora con la experiencia E.
“
Mitchell, 1997
Machine
Learning
Estadística
Visualización
Economía
Bases de
Datos
Procesamiento
de Señales
Ingeniería
Biología
Tipos de Aprendizaje
Automático
2
Aprendizaje
Supervisado
• Modelos
Predictivos.
• La máquina
aprende
explícitamente.
• Predice el futuro a
partir de datos
históricos.
• Resuelve
problemas de
clasificación y
regresión.
Aprendizaje No
Supervisado
• Modelos
Descriptivos.
• La máquina
entiende los datos.
• La evaluación es
cualitativa o
indirecta.
• No realiza
predicciones,
encuentra algo
específico.
Aprendizaje
Reforzado
• Un enfoque de la
IA
• Aprendizaje
basado en los
hallazgos.
• La máquina
aprende a como
actuar en un
determinado
entorno.
• Maximiza los
hallazgos.
Dado un conjunto de datos
de entrenamiento: los
elementos, casos o instancias
En el aprendizaje no
supervisado, se aprende un
modelo a partir de un
conjunto de datos no
etiquetados.
En el aprendizaje
supervisado, se aprende un
modelo a partir de un
conjunto de datos
etiquetados.
Aprendizaje
Supervisado
3
En este tipo de aprendizaje, la máquina aprende de un
conjunto de casos previamente etiquetados por un experto
o de forma semi – automática basándose en los datos, es
decir, para un conjunto de datos de entrada conocemos de
antemano los datos correctos de salida. En el aprendizaje
supervisado, el objetivo es aprender una forma de mapear
las entradas en salidas, cuyos valores correctos son
proporcionados por un supervisor.
Característica
2
Característica 1
Clasificación
Característica
2
Característica 1
Límite de la decisión
Clasificación
Clasificación
Clasificación no lineal
Algoritmos: SVM, árboles de decisión, redes neuronales,
K – nearest neighbors, naive bayes, entre otros.
Regresión
Regresión
Regresión
Regresión
Algoritmos: Regresión Lineal, Regresión Logística.
Aplicaciones
• Reconocimiento de Voz.
• Detección de fraude en tarjetas de crédito.
• Detectar SPAM en un correo.
• Predicciones de la bolsa de valores.
• Detección de enfermedades.
Aprendizaje No
Supervisado
4
El aprendizaje no supervisado es aquél que no requiere de
ningún etiquetado previo de los casos, se basa en los
datos tal y como los recibe y su objetivo es determinar
relaciones de similitud, diferencia o asociación. En el
aprendizaje no supervisado para un conjunto de datos de
entrada, no conocemos de antemano los datos de salida.
El objetivo del aprendizaje no supervisado es encontrar las
regularidades o patrones en la entrada.
Clústering
Se buscan aquellos elementos que son similares entre sí y
distintas de las demás para formar agrupaciones de los
datos llamadas clusters.
Clústering
Algoritmos: K-means, gaussian mixtures, clustering
jerárquico, spectral clustering, entre otros.
Clústering
Reducción de la Dimensionalidad
Se trata de reducir el número de variables de una
colección de datos, a partir de técnicas de asociación,
correlación, consistencia en variables de tipo continúo.
Aplicaciones
Aprendizaje Reforzado
5
En algunas aplicaciones, la salida del sistema es una
secuencia de acciones. En tal caso, una sola acción no es
importante; lo importante es la política que es la secuencia
de acciones correctas para alcanzar la meta, es decir, una
acción es buena si es parte de una buena política. En tal
caso, el programa de aprendizaje automático debe ser
capaz de evaluar la bondad de las políticas y aprender de
secuencias de buenas acciones pasadas para poder
generar una política.
Algoritmos
• Programación dinámica.
• Qlearning.
• SARSA.
Aplicaciones
• Aprender a jugar diferentes Juegos.
• El sistema de navegación de un robot, por ejemplo,
coches autónomos.
• Compresión de imágenes.
Software de ML
6
GNU - GPL
Licencia Código
Abierto BSD
GNU - GPL
WEKA
• Está disponible libremente bajo la licencia GNU – GPL.
• Es muy portable, implementado en Java y puede correr
en casi cualquier plataforma.
• Es fácil de utilizar por un principiante gracias a
su interfaz gráfica de usuario.
• Weka soporta varias tareas estándar de minería de
datos, especialmente, preprocesamiento de
datos, clustering, clasificación, regresión, visualización,
y selección.
R
• R es un sistema para análisis estadísticos y gráficos.
• R tiene una naturaleza doble de programa y lenguaje
de programación.
• R se distribuye gratuitamente bajo los términos de la
GNU – GPL.
• R es un lenguaje Orientado a Objetos, interpretado,
con una sintaxis muy simple e intuitiva.
• R no es tan fácil de aprender como Python.
PYTHON
• Es software libre y gratuito con licencia BSD.
• Es multiplataforma, es un lenguaje de programación de
alto nivel e interpretado, es multiparadigma.
• Su filosofía de diseño enfatiza la simplicidad y
legibilidad de código.
• Posee un núcleo de lenguaje relativamente pequeño,
con el apoyo de magníficas librerías como: NumPy,
SciPy, Scikit-learn, Pandas, IPython, Matplotlib y otras.
Anaconda® es un administrador de paquetes, un
administrador de entornos, una distribución de Python y
una colección de más de 1,000 paquetes de código
abierto. Es de código abierto y fácil de instalar, y ofrece
soporte gratuito a través de su comunidad.
Ecosistema del ML
8
La Inteligencia Artificial es la ciencia de construir máquinas que…
… piensen como
humanos
… actúen como
humanos
… piensen
racionalmente
… actúen
racionalmente
Inteligencia
Artificial
Big Data
Crecimiento
exponencial
de datos
Frecuencia a
la que se
genera los
datos
Diferentes
formatos y
estructuras
de los datos
Exactitud de
los datos y
del cálculo
La ciencia de datos (Data Science) es la ciencia
computacional de la extracción de conocimientos
significativos a partir de datos brutos y luego la
comunicación efectiva de esos conocimientos para generar
valor. (Pierson, 2017)
Data
Science
Lo que la sociedad piensa
que hago
Lo que mis amigos
piensan que hago
Lo que mis familiares
piensan que hago
Lo que otros programadores
piensan que hago
Lo que yo pienso que
hago
Lo que realmente hago

PRESENTACION ML CUN MACHINE LEARNING.pdf

  • 1.
  • 2.
    Definición del ML Tiposde Aprendizaje Automático Aprendizaje Supervisado Aprendizaje No Supervisado Aprendizaje Reforzado Software de ML Ecosistema del ML Índice 1 2 3 4 5 6 7
  • 3.
  • 4.
  • 5.
    En 1959, elcientífico de la IBM Arthur Samuel escribió un programa para jugar damas, para mejorarlo hizo que el programa jugara consigo mismo miles de veces, el programa era capaz de mejorar su rendimiento a través de la experiencia, el programa aprendió y nació el Machine Learning.
  • 6.
    El aprendizaje automáticoo Machine Learning es un método científico que nos permite usar los ordenadores y otros dispositivos con capacidad computacional para que aprendan a extraer los patrones y relaciones que hay en nuestros datos por sí solos. Esos patrones se pueden usar luego para predecir comportamientos y en la toma de decisiones.
  • 7.
    El Aprendizaje Automáticoes un campo en la Inteligencia Artificial, donde las máquinas pueden "aprender" de sí mismas, sin ser explícitamente programadas por los seres humanos. Analizando datos pasados llamados "datos de entrenamiento", el modelo de Aprendizaje Automático forma patrones y usa estos patrones para aprender y hacer predicciones futuras.
  • 8.
    "Se dice queun programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y la medida de rendimiento P, si su rendimiento en tareas en T, medido por P, mejora con la experiencia E. “ Mitchell, 1997
  • 9.
  • 10.
  • 11.
    Aprendizaje Supervisado • Modelos Predictivos. • Lamáquina aprende explícitamente. • Predice el futuro a partir de datos históricos. • Resuelve problemas de clasificación y regresión. Aprendizaje No Supervisado • Modelos Descriptivos. • La máquina entiende los datos. • La evaluación es cualitativa o indirecta. • No realiza predicciones, encuentra algo específico. Aprendizaje Reforzado • Un enfoque de la IA • Aprendizaje basado en los hallazgos. • La máquina aprende a como actuar en un determinado entorno. • Maximiza los hallazgos.
  • 15.
    Dado un conjuntode datos de entrenamiento: los elementos, casos o instancias En el aprendizaje no supervisado, se aprende un modelo a partir de un conjunto de datos no etiquetados. En el aprendizaje supervisado, se aprende un modelo a partir de un conjunto de datos etiquetados.
  • 16.
  • 17.
    En este tipode aprendizaje, la máquina aprende de un conjunto de casos previamente etiquetados por un experto o de forma semi – automática basándose en los datos, es decir, para un conjunto de datos de entrada conocemos de antemano los datos correctos de salida. En el aprendizaje supervisado, el objetivo es aprender una forma de mapear las entradas en salidas, cuyos valores correctos son proporcionados por un supervisor.
  • 19.
  • 20.
  • 21.
  • 22.
    Clasificación no lineal Algoritmos:SVM, árboles de decisión, redes neuronales, K – nearest neighbors, naive bayes, entre otros.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
    Aplicaciones • Reconocimiento deVoz. • Detección de fraude en tarjetas de crédito. • Detectar SPAM en un correo. • Predicciones de la bolsa de valores. • Detección de enfermedades.
  • 28.
  • 29.
    El aprendizaje nosupervisado es aquél que no requiere de ningún etiquetado previo de los casos, se basa en los datos tal y como los recibe y su objetivo es determinar relaciones de similitud, diferencia o asociación. En el aprendizaje no supervisado para un conjunto de datos de entrada, no conocemos de antemano los datos de salida. El objetivo del aprendizaje no supervisado es encontrar las regularidades o patrones en la entrada.
  • 31.
    Clústering Se buscan aquelloselementos que son similares entre sí y distintas de las demás para formar agrupaciones de los datos llamadas clusters.
  • 32.
  • 33.
    Algoritmos: K-means, gaussianmixtures, clustering jerárquico, spectral clustering, entre otros. Clústering
  • 34.
    Reducción de laDimensionalidad Se trata de reducir el número de variables de una colección de datos, a partir de técnicas de asociación, correlación, consistencia en variables de tipo continúo.
  • 35.
  • 37.
  • 38.
    En algunas aplicaciones,la salida del sistema es una secuencia de acciones. En tal caso, una sola acción no es importante; lo importante es la política que es la secuencia de acciones correctas para alcanzar la meta, es decir, una acción es buena si es parte de una buena política. En tal caso, el programa de aprendizaje automático debe ser capaz de evaluar la bondad de las políticas y aprender de secuencias de buenas acciones pasadas para poder generar una política.
  • 41.
    Algoritmos • Programación dinámica. •Qlearning. • SARSA. Aplicaciones • Aprender a jugar diferentes Juegos. • El sistema de navegación de un robot, por ejemplo, coches autónomos. • Compresión de imágenes.
  • 42.
  • 43.
    GNU - GPL LicenciaCódigo Abierto BSD GNU - GPL
  • 44.
    WEKA • Está disponiblelibremente bajo la licencia GNU – GPL. • Es muy portable, implementado en Java y puede correr en casi cualquier plataforma. • Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario. • Weka soporta varias tareas estándar de minería de datos, especialmente, preprocesamiento de datos, clustering, clasificación, regresión, visualización, y selección.
  • 45.
    R • R esun sistema para análisis estadísticos y gráficos. • R tiene una naturaleza doble de programa y lenguaje de programación. • R se distribuye gratuitamente bajo los términos de la GNU – GPL. • R es un lenguaje Orientado a Objetos, interpretado, con una sintaxis muy simple e intuitiva. • R no es tan fácil de aprender como Python.
  • 46.
    PYTHON • Es softwarelibre y gratuito con licencia BSD. • Es multiplataforma, es un lenguaje de programación de alto nivel e interpretado, es multiparadigma. • Su filosofía de diseño enfatiza la simplicidad y legibilidad de código. • Posee un núcleo de lenguaje relativamente pequeño, con el apoyo de magníficas librerías como: NumPy, SciPy, Scikit-learn, Pandas, IPython, Matplotlib y otras.
  • 48.
    Anaconda® es unadministrador de paquetes, un administrador de entornos, una distribución de Python y una colección de más de 1,000 paquetes de código abierto. Es de código abierto y fácil de instalar, y ofrece soporte gratuito a través de su comunidad.
  • 51.
  • 53.
    La Inteligencia Artificiales la ciencia de construir máquinas que… … piensen como humanos … actúen como humanos … piensen racionalmente … actúen racionalmente Inteligencia Artificial
  • 55.
  • 56.
    Crecimiento exponencial de datos Frecuencia a laque se genera los datos Diferentes formatos y estructuras de los datos Exactitud de los datos y del cálculo
  • 57.
    La ciencia dedatos (Data Science) es la ciencia computacional de la extracción de conocimientos significativos a partir de datos brutos y luego la comunicación efectiva de esos conocimientos para generar valor. (Pierson, 2017) Data Science
  • 58.
    Lo que lasociedad piensa que hago Lo que mis amigos piensan que hago Lo que mis familiares piensan que hago Lo que otros programadores piensan que hago Lo que yo pienso que hago Lo que realmente hago