2. Luis Beltrán • Estudiante de Doctorado en Tomás Bata University
in Zlín
• Docente en Tecnológico Nacional de México en
Celaya
• Microsoft MVP en IA y Tecnologías de Desarrollador
luis@luisbeltran.mx
luis.beltran@itcelaya.edu.mx
13. Datos:
Ø El largo del pico del pingüino.
Ø La profundidad del pico del pingüino.
Ø El largo de la aleta del pingüino.
Ø El peso del pingüino.
_x**=[x 1, x 2, x 3, x 4].
Se desea predecir (y) la especie de pingüino:
Ø Adelia (clase 0)
Ø Papúa (clase 1)
Ø Barbijo (clase 2)
Para x=[37.3, 16.8, 19.2, 30.0], y=[1, 0, 0]
14.
15. Prepara tus Datos Construye y Entrena Ejecuta
Consumo del modelo
Usuario final
ML model ML model
Creación del modelo
Datasets
Flujo de Acción
https://archive.ics.uci.edu/ml/datasets.php
16. Modelos
• Machine Learning “Tradicional”
• Support Vector Machines
• Árboles de Decisión
• Random Forest
• …
• Métodos de “Deep” Learning
• Redes neuronales
• Redes neuronales de Convolución (CNN)
• Redes neuronales de Recurrentes (RNN)
• Generative Adversarial Network (GAN)
• …
17. Cálculo de la pérdida
• Supongamos que uno de los ejemplos transmitidos a través del proceso de
entrenamiento contiene las características de un pingüino de Adelia (clase 0).
• La salida correcta de la red sería [1, 0, 0].
• Supongamos que para un dato la red genera la salida [0.4, 0.3, 0.3].
• Si las comparamos, podemos calcular una varianza absoluta para cada elemento (la
distancia entre cada valor previsto y el valor que debería ser) como [0.6, 0.3, 0.3].
• Dado que en la práctica se procesan varias observaciones, generalmente se agrega la
varianza, por ejemplo, elevando cada valor al cuadrado y luego calculando la media
para terminar con un solo valor de pérdida promedio, como 0.18.
19. Herramientas para ML / DL
• Lenguajes de programación
• Python
• R
• C++
• ...
• Librerías / Frameworks
• scikit-learn
• PyTorch
• TensorFlow
• Keras
• …
classic machine learning
deep learning frameworks
20. scikit-learn
• Exporación de datos
• Preprocesamiento de datos
• Limpieza de valores
• Normalización
• Entrenamiento
• Prueba
• Aplicación
• Machine Learning ”clásico"
• https://scikit-learn.org/stable/
20
pip install scikit-learn
21. Keras y Tensorflow
• Keras es una librería de alto nivel que facilita la creación de redes
neuronales (capas)
• En background, el motor que ejecutará la red neuronal y la entrenará
es la implementación de Google llamada Tensorflow.
22. Colaboratory
● Es un documento ejecutable en Google Drive (Python Jupyter Notebook).
● Nos permite programar ejecutar y compartir nuestro código con otras personas.
● Es un documento compuesto por celdas que pueden ser texto enriquecido,
imágenes o código python.
● Permite ejecutar código python en un entorno con CPU’s o GPU’s de forma
gratuita.
● Facilita la visualización de los resultados de forma interactiva y provee de una
galería de snippets de código para nuestras necesidades.
● Nos permite compartir como cualquier documento google drive o hacia github
https://colab.research.google.com/
24. Ejercicio #1 – Entrenamiento de una red
neuronal profunda
https://colab.research.google.com/drive/1lRbgGCmgmDKiCXEuUy_gyQgoAR8otTXb?usp=sharing
25. Redes Neuronales Convolucionales (CNN)
• Si bien puede usar modelos de DL para cualquier tipo de ML, resultan
especialmente útiles para trabajar con datos que constan de grandes
matrices de valores numéricos, como imágenes.
• Los modelos de ML que funcionan con imágenes son la base de una área
de IA conocida como Computer Vision. Además, las técnicas de DL han
impulsado avances asombrosos en esta área durante los últimos años.
• El motivo del éxito del DL en esta área es un tipo de modelo llamado red
neuronal convolucional (CNN)
26. Convolutional Neural Networks
• Las Convolutional Neural Networks son redes multilayered que toman
su inspiración del cortex visual de los animales.
• Esta arquitectura es útil en varias aplicaciones,
principalmente procesamiento de imágenes.
• La primera CNN fue creada por Yann LeCun y estaba enfocada en el
reconocimiento de letras manuscritas.
31. • La arquitectura constaba de varias capas que implementaban la extracción de
características y luego la clasificación.
• La imagen se divide en campos receptivos que alimentan una capa convolutional que
extrae features de la imagen de entrada (Por ejemplo, detectar lineas verticales,
vértices, etc).
• El siguiente paso es pooling que reduce la dimensionalidad de las features
extraídas manteniendo la información más importante.
• Luego se hace una nueva convolución y otro pooling que alimenta una red
feedforward multicapa.
• La salida final de la red es un grupo de nodos que clasifican el resultado, por ejemplo
un nodo para cada número del 0 al 9 (es decir, 10 nodos, se “activan” de a uno).
32. Ejercicio #2 – Entrenamiento de una red
neuronal convolucional
https://drive.google.com/drive/folders/1O0KNYzlTWtEwlv4P1ihj6Rkm79pWmvmf?usp=sharing
https://colab.research.google.com/drive/1rDLjk7_cpmn4PSFG4hgG_dW9cCQ0Gbuu?usp=sharing
35. Deep Q and A: IBM Watson
Watson emergió ganador cuando se enfrentó a los jugadores mejor calificados de
todos los tiempos en la historia de Jeopardy.
Source: IBM Research
36. Aplicaciones
Biología de la Computación
(Aprendizaje de estructuras)
Animación y control
Seguimiento y reconocimiento de actividad
37. Generative AI
Métodos de ML que aprenden
sobre contenido u objetos a
partir de sus datos y los utilizan
para generar artefactos realistas,
completamente nuevos y
originales.
38. Beneficios
• Generación de resultados de mayor calidad.
• Reducir los riesgos asociados a un proyecto.
• Entrenamiento de modelos reforzados de
aprendizaje automático para que sean
menos sesgados.
• Habilitación de la predicción de
profundidad sin sensores.
• Habilitación de la localización y
regionalización de contenido a través de
deepfakes.
• Permitir que los robots comprendan
conceptos más abstractos tanto en
simulación como en el mundo real.
39. Aplicaciones
• Creando código de software
• Facilitar el desarrollo de medicamentos
• Publicidad dirigida
• Protección de identidad
• Procesamiento de imágenes
• Restauración de películas
• Síntesis de audio
• Cuidado de la salud
Para 2025, Gartner espera que la IA generativa represente el 10% de todos los datos producidos, frente al 1% actual.
40. Usos indebidos y limitaciones
• Dificil de controlar
• Pseudo imaginación
• Seguridad
• Estafas
• Fraude
• Desinformación política
• Identidades falsificadas
41. ¿Cómo ser parte del desarrollo de la IA?
https://aka.ms/ml-beginners
https://es.coursera.org/learn/machine-learning
42. Hacia una IA responsable
• Justa
Los sistemas de IA deben tratar a todas las personas de manera justa
• Fiable y Segura
Los sistemas de IA deben funcionar de manera confiable y segura
• Privacidad y seguridad
Los sistemas de IA deben ser seguros y respetar la privacidad
• Inclusiva
Los sistemas de IA deben empoderar a todos e involucrar a las personas
• Transparente
Los sistemas de IA deben ser comprensibles
• Responsable
Las personas deben ser responsables de los sistemas de IA
43. Para aprender más
Introducción a TensorFlow
https://www.tensorflow.org/learn
Deep Learning (Kaggle)
https://www.kaggle.com/learn/intro-to-deep-learning
Machine Learning for Beginners
https://aka.ms/ml-beginners