SlideShare una empresa de Scribd logo
Aprendizaje automático I
ODS 12, 13
Tema 5: Aprendizaje Automático
No-Supervisado
2
Tema 5: Aprendizaje automático No-Supervisado
Algoritmos de
machine
learning
No-Supervisado
Introducción
Ejemplos
Ejemplos en
Python
Clustering,
Asociación y
Reducción de
dimensionalidad
Conceptos principales
Aprendizaje Automático No-Supervisado
4
• La segunda gran familia de algoritmos de aprendizaje automático son los algoritmos No-Supervisados
(Unsupervised Machine Learning)
• En los modelos no-supervisados, no conocemos el resultado objetivo, no tenemos muestras con
etiquetas con las que entrenar el algoritmo. Sólo disponemos de los datos independientes (xi). El
algoritmo no-supervisado extrae información nueva o conocimiento. Descubren agrupaciones o
patrones ocultos sin necesidad de intervención humana
• Para evaluar la precisión o calidad de un modelo no-supervisado, existen técnicas específicas (si no
tenemos datos de test): índice Rand, índice Calinski-Harabasz, etc (disponibles en scikit-learn)
• Su capacidad de descubrir similitudes y diferencias en los datos lo convierten en la solución ideal para
análisis exploratorios, la venta cruzada, la segmentación de clientes y el reconocimiento de imágenes
ü Visión computacional: tareas de percepción visual, como el reconocimiento de objetos
ü Imágenes médicas: funciones básicas a los dispositivos de creación de imágenes médicas, como
la detección, la clasificación y la segmentación de imágenes, que se utilizan en radiología y
anatomía patológica para diagnosticar a pacientes de forma rápida y precisa
ü Detección de anomalías: analizar grandes cantidades de datos y descubrir puntos atípicos dentro
de un conjunto de datos. Estas anomalías pueden concienciar sobre equipos defectuosos, errores
humanos o en la seguridad
ü Motores de recomendación: utilizando datos de comportamiento de compras anteriores, el
aprendizaje no supervisado descubre tendencias de datos que pueden utilizarse para desarrollar
estrategias de venta cruzada más eficaces
Aprendizaje Automático No-Supervisado
5
• Un buen ejemplo de aplicación en el mundo empresarial es el recommender de Netflix
• 80% de las visualizaciones proviene de recomendaciones hechas por el algoritmo
• En negocios digitales, la abundancia de datos (Big Data) convierte estos algoritmos en el core del negocio. Esto
permite a Netflix una propuesta de valor mejorada respecto productores tradicionales de contenidos
https://youtu.be/VvTYuQPINec
https://youtu.be/f8OK1HBEgn0
Aprendizaje Automático No-Supervisado
6
• O la conducción autónoma dirigida por aprendizaje automático
https://youtu.be/6v036bBD31o
Algoritmos de ML No-Supervisado
7
• A continuación algunos de los principales algoritmos utilizados en aprendizaje automático no-supervisado
ü Agrupación en clústeres
• K-Means
• Jerárquico
• Modelos Gaussianos
ü Asociación
• Algoritmo Apriori
ü Reducción de dimensionalidad
• Análisis de Componentes Principales (PCA)
• Veremos el detalle de funcionamiento e implementación durante el curso. En el Tema 6 veremos el algoritmo
K-Means no supervisado aplicado a nuestro problema de las flores de Iris (Visto en Tema 1 y siguientes)
Algoritmos de Agrupación en clústers
8
• En términos básicos, el objetivo de la agrupación es
encontrar diferentes grupos dentro de los elementos de los
datos. Para ello, los algoritmos de agrupamiento
encuentran la estructura en los datos de manera que los
elementos del mismo clúster (o grupo) sean más similares
entre sí que con los de clústeres diferentes
• Algunos de los algoritmos de agrupación más comunes son:
ü K-Means
ü Clusterización Jerárquica
ü Density Based Scan Clustering (DBSCAN)
ü Modelo de Agrupamiento Gausiano
• A continuación veremos los tres primeros algoritmos, más
habituales. Para ver un ejemplo de clustering Gausiano,
podéis consultar el siguiente vídeo para agrupar imágenes
por colores:
https://youtu.be/DODphRRL79c?si=mohjlr9FORdmzqev
Algoritmo K-Means
9
• El algoritmo K-Means, o de K-medias, tiene como objetivo encontrar y agrupar en clases los puntos de datos que
tienen una alta similitud entre ellos. En los términos del algoritmo, esta similitud se entiende como lo opuesto de la
distancia entre puntos de datos. Cuanto más cerca estén los puntos de datos, más similares y con más
probabilidades de pertenecer al mismo clúster serán
• El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide (o baricentro) de su
grupo o cluster
• En el tema 6 profundizaremos en la implementación y formulación matemática del algoritmo
https://youtu.be/EZOab1vkFmI
Algoritmos Clusterización Jerárquica
10
• La Agrupación jerárquica es una alternativa a otros algoritmos de
agrupación. La principal ventaja de la agrupación jerárquica es que no
necesitamos especificar el número de agrupaciones, la encontrará por
sí misma.
• Además, permite el trazado de dendogramas. Los dendogramas son
visualizaciones de una agrupación jerárquica binaria. Las observaciones
que se fusionan en la parte inferior son similares, mientras que las que
están en la parte superior son muy diferentes. Con los dendogramas,
las conclusiones se hacen basándose en la ubicación del eje vertical y
no en el horizontal.
• Existen dos enfoques para este tipo de agrupación: aglomerativo y
divisivo
• Divisivo: comienza por englobar todos los puntos de datos en un
solo grupo. Luego, dividirá el grupo iterativamente en otros más
pequeños hasta que cada uno de ellos contenga sólo una muestra
• Aglomerativo: comienza con cada muestra siendo un grupo
diferente y luego fusionándolas por las que están más cerca unas
de otras hasta que sólo haya un grupo
https://youtu.be/T76paW6fJBI
Representación en Dendograma
Algoritmos Asociación
11
• Un algoritmo de asociación es un método basado en reglas para detectar relaciones entre variables en un
conjunto de datos determinado
• Estos métodos se utilizan con frecuencia para análisis de cesta de la compra, que permiten a las empresas
comprender mejor las relaciones entre los diferentes productos. Entender los hábitos de consumo de los
clientes permite a las empresas desarrollar mejores estrategias de venta cruzada y motores de
recomendaciones
• Ejemplos como: "Los clientes que compraron este artículo también compraron" de Amazon o la lista
"Descubrimiento semanal" de Spotify
• Incluyen diferentes algoritmos para generar reglas de asociación, como Apriori, Eclat y FP-Growth
• El algoritmo Apriori es el más utilizado. Se han popularizado en los análisis de cesta de la compra, que
generan diferentes motores de recomendaciones para plataformas de música y comercios en línea. Se
utilizan dentro de conjuntos de datos transaccionales para identificar conjuntos de elementos frecuentes, o
colecciones de elementos, para identificar la probabilidad de consumir un producto dado el consumo de
otro producto. A continuación podéis encontrar un ejemplo del funcionamiento
Algoritmo Apriori
12
• Ejemplo aplicación del algoritmo Apriori en la propensión de compra. Podéis ver también materiales extra
específicos del algoritmo en la plataforma del Aula
• Vamos a analizar la asociación del ejemplo: los que compran harina y huevo, también compran leche
• Conceptos clave del algoritmo: soporte, confianza, elevación y convicción
https://view.genial.ly/5eb9403d7792c20d16619258/dossier-apriori-funcionnamiento
Algoritmos de Reducción de dimensionalidad
13
• La reducción de la dimensionalidad es una técnica utilizada cuando el número de características, o
dimensiones, de un determinado conjunto de datos es demasiado elevado. Reduce el número de
entradas de datos a un tamaño gestionable, además de preservar la integridad del conjunto de
datos lo máximo posible
• Se usa comúnmente en la fase de preprocesamiento de datos, y existen varios métodos de
reducción de dimensionalidad:
ü Análisis de componentes principales (o PCA): Este método utiliza una transformación
lineal para crear una nueva representación de datos, dando como resultado un conjunto
de componentes principales
ü Descomposición en valores singulares: La descomposición en valores singulares (SVD,
por sus siglas en inglés) es otro enfoque a la reducción de dimensionalidad que factoriza
una matriz, A, en tres matrices de rango inferior. SVD se denota mediante la fórmula A =
USVT, donde U y V son matrices ortogonales. S es una matriz diagonal y los valores de S
se consideran valores singulares de la matriz A. Similar a PCA, se suele utilizar para
reducir el ruido y comprimir datos, como archivos de imágenes
ü Codificadores automáticos (redes neuronales): para comprimir los datos y luego volver a
crear una nueva representación de la entrada de datos original
Algoritmo PCA
14
• La intuición detrás del Algoritmo PCA es la siguiente. Imaginemos por ejemplo que queremos predecir
los precios de alquiler de vivienda del mercado. Tendremos en cuenta muchas variables diversas como:
tipo de vivienda, tamaño de la vivienda, antigüedad, servicios, habitaciones, con/sin jardín, con/sin
piscina, con/sin muebles; pero también podemos tener en cuenta la distancia al centro, si hay
colegio en las cercanías, o supermercados, si es un entorno ruidoso, si tiene autopistas en las
cercanías, la “seguridad del barrio”, si se aceptan mascotas, tiene wifi, tiene garaje, trastero… y seguir
sumando variables
• Es posible que cuanta más (y mejor) información, obtengamos una predicción más acertada. Pero
también empezaremos a notar que la ejecución de los algoritmos (regresión lineal, redes neuronales,
etc) es menos eficiente
• Es posible que algunas de las variables sean menos importantes y no aporten demasiado valor a la
predicción. También podríamos generar overfitting
• Veremos también en este Tema 5 un ejemplo aplicado al reconocimiento de imágenes faciales. PCA
como paso previo de un algoritmo supervisado de clasificación SVM. Es habitual este uso combinado de
algoritmos de machine learning
Algoritmo PCA
15
• El algoritmo de Análisis de Componentes Principales (PCA o Principal Component Analysis) es una
técnica de Extracción de Características donde combinamos las entradas de una manera específica y
podemos eliminar algunas de las variables menos importantes manteniendo la parte más importante .
Además, luego de aplicar PCA conseguiremos que todas las nuevas variables sean independientes una
de otra (ortogonales)
• El método numérico consiste en:
• Estandarizar los datos de entrada (normalización de las variables)
• Obtener los vectores y valores propios principales de la matriz de covarianza
• Ordenar los valores propios de mayor a menor y elegir los k vectores que se correspondan con los
valores propios k más grandes (donde k es el número de dimensiones del nuevo subespacio de
características)
• Construir la matriz de proyección (o cambio de base) W con los k vectores propios seleccionados
• Transformamos el dataset original X estandarizado vía W para obtener las nuevas características k-
dimensionales
• Podemos utilizar las librerías scikit-learn para la implementación práctica en Python, como veremos a
continuación
Implementación Algoritmo PCA
16
• Vamos a ver el uso de PCA en el preproceso de los
datos en un problema de reconocimiento facial
• En el caso práctico, utilizamos la base de datos
Labeled Faces in the Wild
• Importamos los datos en arrays de numpy
http://vis-www.cs.umass.edu/lfw/
Implementación Algoritmo PCA
17
Implementación Algoritmo PCA
18
• Dividimos de la forma habitual (ver Tema 2) en los proyectos de aprendizaje automático la base de datos en train y test (25%)
• Aplicamos PCA con la base de datos de imágenes faciales, sin utilizar las etiquetas (aprendizaje no-supervisado). El objetivo es
reducir la dimensión
Implementación Algoritmo PCA + Clasificación SVM
19
• Si queremos terminar el proceso de aprendizaje automático para clasificar imágenes nuevas a partir del dataset
preprocesado, el siguiente paso es entrenar un modelo de clasificación. Vamos a utilizar para este ejemplo un modelo
supervisado del Tema 2: Suport Vector Machine o SVM (de la librería scikit-learn)
• Comentar que los problemas de reconocimiento de imágenes suelen resolverse también mediante algoritmos de
aprendizaje automático basados en redes neuronales convolucionales. Las podéis encontrar en librerías como pytorch o
tensorflow mencionadas en el Tema 1
• Un ejemplo de la librería tensorflow: https://www.tensorflow.org/tutorials/keras/classification?hl=es-419
Implementación Algoritmo PCA + Clasificación SVM
20
• Evaluación del performance del modelo sobre los datos test:
Sede Universitat Carlemany
Av. Verge de Canòlich, 47
AD600 Sant Julià de Lòria
Principat d’Andorra
Linkedin Facebook
+376 878 300

Más contenido relacionado

Similar a Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf

Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
LPI ONG
 
BigData 101 / Cursillo (Parte2)
BigData 101 / Cursillo (Parte2)BigData 101 / Cursillo (Parte2)
BigData 101 / Cursillo (Parte2)
andres hurtado
 
Machine learning for business
Machine learning for businessMachine learning for business
Machine learning for business
Fran Castillo
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Magaly Portocarrero Labajos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
karin juneth soto horna
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
amdia
 
Preparación de la propuesta de sistemas
Preparación de la propuesta de sistemasPreparación de la propuesta de sistemas
Preparación de la propuesta de sistemasDarkmrt
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
Eduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
Eduardo Castro
 
Sistemas estrategicos
Sistemas estrategicosSistemas estrategicos
Sistemas estrategicos
Ruiiz Jøorge Daniiel'
 
BigData 101 / Cursillo (Parte3)
BigData 101 / Cursillo (Parte3)BigData 101 / Cursillo (Parte3)
BigData 101 / Cursillo (Parte3)
andres hurtado
 
53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning
Stratebi
 
Dm 01
Dm 01Dm 01
Proyecto final "publisher, access y bases de datos"
Proyecto final "publisher, access y bases de datos"Proyecto final "publisher, access y bases de datos"
Proyecto final "publisher, access y bases de datos"
Paulinalopezb
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Introducción a machine learning
Introducción a machine learningIntroducción a machine learning
Introducción a machine learning
Virginia Peón García
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgSnoop Consulting
 

Similar a Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf (20)

Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
 
BigData 101 / Cursillo (Parte2)
BigData 101 / Cursillo (Parte2)BigData 101 / Cursillo (Parte2)
BigData 101 / Cursillo (Parte2)
 
Machine learning for business
Machine learning for businessMachine learning for business
Machine learning for business
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Preparación de la propuesta de sistemas
Preparación de la propuesta de sistemasPreparación de la propuesta de sistemas
Preparación de la propuesta de sistemas
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Sistemas estrategicos
Sistemas estrategicosSistemas estrategicos
Sistemas estrategicos
 
BigData 101 / Cursillo (Parte3)
BigData 101 / Cursillo (Parte3)BigData 101 / Cursillo (Parte3)
BigData 101 / Cursillo (Parte3)
 
53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning53 Claves para conocer Machine Learning
53 Claves para conocer Machine Learning
 
Dm 01
Dm 01Dm 01
Dm 01
 
Taller 3 Karen Agudelo Carmona
Taller 3 Karen Agudelo CarmonaTaller 3 Karen Agudelo Carmona
Taller 3 Karen Agudelo Carmona
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Proyecto final "publisher, access y bases de datos"
Proyecto final "publisher, access y bases de datos"Proyecto final "publisher, access y bases de datos"
Proyecto final "publisher, access y bases de datos"
 
Presentación final
Presentación finalPresentación final
Presentación final
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Introducción a machine learning
Introducción a machine learningIntroducción a machine learning
Introducción a machine learning
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 

Más de Gerard Alba

TV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdfTV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdf
Gerard Alba
 
Module3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdfModule3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdf
Gerard Alba
 
Module1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdfModule1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdf
Gerard Alba
 
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdfAprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Gerard Alba
 
Aprendizaje automático I - Sesión 4 Árboles de Decisión.pdf
Aprendizaje automático I - Sesión 4 Árboles de Decisión.pdfAprendizaje automático I - Sesión 4 Árboles de Decisión.pdf
Aprendizaje automático I - Sesión 4 Árboles de Decisión.pdf
Gerard Alba
 
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdfAprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Gerard Alba
 
Aprendizaje automático I - Sesión 2 Caso Práctico.pdf
Aprendizaje automático I - Sesión 2 Caso Práctico.pdfAprendizaje automático I - Sesión 2 Caso Práctico.pdf
Aprendizaje automático I - Sesión 2 Caso Práctico.pdf
Gerard Alba
 
Aprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdfAprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdf
Gerard Alba
 
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptxAlgoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Gerard Alba
 
Master class Fintech
Master class FintechMaster class Fintech
Master class Fintech
Gerard Alba
 
EFPA ESG Advisor - summary
EFPA ESG Advisor - summaryEFPA ESG Advisor - summary
EFPA ESG Advisor - summary
Gerard Alba
 
Gestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - RoboadvisorsGestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - Roboadvisors
Gerard Alba
 
Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524
Gerard Alba
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
Gerard Alba
 
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Gerard Alba
 
Specialized Functions in Finance 201605
Specialized Functions in Finance 201605Specialized Functions in Finance 201605
Specialized Functions in Finance 201605
Gerard Alba
 
ANDBANK Microfinance Fund
ANDBANK Microfinance FundANDBANK Microfinance Fund
ANDBANK Microfinance Fund
Gerard Alba
 
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
Gerard Alba
 
Plan pensiones Andbank
Plan pensiones AndbankPlan pensiones Andbank
Plan pensiones Andbank
Gerard Alba
 
Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403Gerard Alba
 

Más de Gerard Alba (20)

TV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdfTV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdf
 
Module3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdfModule3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdf
 
Module1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdfModule1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdf
 
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdfAprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
 
Aprendizaje automático I - Sesión 4 Árboles de Decisión.pdf
Aprendizaje automático I - Sesión 4 Árboles de Decisión.pdfAprendizaje automático I - Sesión 4 Árboles de Decisión.pdf
Aprendizaje automático I - Sesión 4 Árboles de Decisión.pdf
 
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdfAprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
 
Aprendizaje automático I - Sesión 2 Caso Práctico.pdf
Aprendizaje automático I - Sesión 2 Caso Práctico.pdfAprendizaje automático I - Sesión 2 Caso Práctico.pdf
Aprendizaje automático I - Sesión 2 Caso Práctico.pdf
 
Aprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdfAprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdf
 
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptxAlgoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
 
Master class Fintech
Master class FintechMaster class Fintech
Master class Fintech
 
EFPA ESG Advisor - summary
EFPA ESG Advisor - summaryEFPA ESG Advisor - summary
EFPA ESG Advisor - summary
 
Gestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - RoboadvisorsGestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - Roboadvisors
 
Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
 
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
 
Specialized Functions in Finance 201605
Specialized Functions in Finance 201605Specialized Functions in Finance 201605
Specialized Functions in Finance 201605
 
ANDBANK Microfinance Fund
ANDBANK Microfinance FundANDBANK Microfinance Fund
ANDBANK Microfinance Fund
 
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
 
Plan pensiones Andbank
Plan pensiones AndbankPlan pensiones Andbank
Plan pensiones Andbank
 
Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403
 

Último

(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
JulyMuoz18
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
cj3806354
 
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdfEstructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
IsabellaRubio6
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
ItsSofi
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
DanielErazoMedina
 
biogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectosbiogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectos
Luis Enrique Zafra Haro
 
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
marianabz2403
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
cdraco
 
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB  S2. PARA VSATMANUAL DEL DECODIFICADOR DVB  S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
Ing. Julio Iván Mera Casas
 
proyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmusproyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmus
raquelariza02
 
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
espinozaernesto427
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
AlejandraCasallas7
 
EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
PABLOCESARGARZONBENI
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
rafaelsalazar0615
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
cofferub
 
Diagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestreDiagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestre
DiegoCampos433849
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
JimmyTejadaSalizar
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
Emilio Casbas
 
Diagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdfDiagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdf
ManuelCampos464987
 

Último (20)

(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
 
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdfTrabajo Coding For kids 1 y 2 grado 9-4.pdf
Trabajo Coding For kids 1 y 2 grado 9-4.pdf
 
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdfEstructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
 
biogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectosbiogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectos
 
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
 
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB  S2. PARA VSATMANUAL DEL DECODIFICADOR DVB  S2. PARA VSAT
MANUAL DEL DECODIFICADOR DVB S2. PARA VSAT
 
proyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmusproyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmus
 
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
 
EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
 
Diagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestreDiagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestre
 
maestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdfmaestria-motores-combustion-interna-alternativos (1).pdf
maestria-motores-combustion-interna-alternativos (1).pdf
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
 
Diagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdfDiagrama de flujo basada en la reparacion de automoviles.pdf
Diagrama de flujo basada en la reparacion de automoviles.pdf
 

Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf

  • 2. Tema 5: Aprendizaje Automático No-Supervisado 2
  • 3. Tema 5: Aprendizaje automático No-Supervisado Algoritmos de machine learning No-Supervisado Introducción Ejemplos Ejemplos en Python Clustering, Asociación y Reducción de dimensionalidad Conceptos principales
  • 4. Aprendizaje Automático No-Supervisado 4 • La segunda gran familia de algoritmos de aprendizaje automático son los algoritmos No-Supervisados (Unsupervised Machine Learning) • En los modelos no-supervisados, no conocemos el resultado objetivo, no tenemos muestras con etiquetas con las que entrenar el algoritmo. Sólo disponemos de los datos independientes (xi). El algoritmo no-supervisado extrae información nueva o conocimiento. Descubren agrupaciones o patrones ocultos sin necesidad de intervención humana • Para evaluar la precisión o calidad de un modelo no-supervisado, existen técnicas específicas (si no tenemos datos de test): índice Rand, índice Calinski-Harabasz, etc (disponibles en scikit-learn) • Su capacidad de descubrir similitudes y diferencias en los datos lo convierten en la solución ideal para análisis exploratorios, la venta cruzada, la segmentación de clientes y el reconocimiento de imágenes ü Visión computacional: tareas de percepción visual, como el reconocimiento de objetos ü Imágenes médicas: funciones básicas a los dispositivos de creación de imágenes médicas, como la detección, la clasificación y la segmentación de imágenes, que se utilizan en radiología y anatomía patológica para diagnosticar a pacientes de forma rápida y precisa ü Detección de anomalías: analizar grandes cantidades de datos y descubrir puntos atípicos dentro de un conjunto de datos. Estas anomalías pueden concienciar sobre equipos defectuosos, errores humanos o en la seguridad ü Motores de recomendación: utilizando datos de comportamiento de compras anteriores, el aprendizaje no supervisado descubre tendencias de datos que pueden utilizarse para desarrollar estrategias de venta cruzada más eficaces
  • 5. Aprendizaje Automático No-Supervisado 5 • Un buen ejemplo de aplicación en el mundo empresarial es el recommender de Netflix • 80% de las visualizaciones proviene de recomendaciones hechas por el algoritmo • En negocios digitales, la abundancia de datos (Big Data) convierte estos algoritmos en el core del negocio. Esto permite a Netflix una propuesta de valor mejorada respecto productores tradicionales de contenidos https://youtu.be/VvTYuQPINec https://youtu.be/f8OK1HBEgn0
  • 6. Aprendizaje Automático No-Supervisado 6 • O la conducción autónoma dirigida por aprendizaje automático https://youtu.be/6v036bBD31o
  • 7. Algoritmos de ML No-Supervisado 7 • A continuación algunos de los principales algoritmos utilizados en aprendizaje automático no-supervisado ü Agrupación en clústeres • K-Means • Jerárquico • Modelos Gaussianos ü Asociación • Algoritmo Apriori ü Reducción de dimensionalidad • Análisis de Componentes Principales (PCA) • Veremos el detalle de funcionamiento e implementación durante el curso. En el Tema 6 veremos el algoritmo K-Means no supervisado aplicado a nuestro problema de las flores de Iris (Visto en Tema 1 y siguientes)
  • 8. Algoritmos de Agrupación en clústers 8 • En términos básicos, el objetivo de la agrupación es encontrar diferentes grupos dentro de los elementos de los datos. Para ello, los algoritmos de agrupamiento encuentran la estructura en los datos de manera que los elementos del mismo clúster (o grupo) sean más similares entre sí que con los de clústeres diferentes • Algunos de los algoritmos de agrupación más comunes son: ü K-Means ü Clusterización Jerárquica ü Density Based Scan Clustering (DBSCAN) ü Modelo de Agrupamiento Gausiano • A continuación veremos los tres primeros algoritmos, más habituales. Para ver un ejemplo de clustering Gausiano, podéis consultar el siguiente vídeo para agrupar imágenes por colores: https://youtu.be/DODphRRL79c?si=mohjlr9FORdmzqev
  • 9. Algoritmo K-Means 9 • El algoritmo K-Means, o de K-medias, tiene como objetivo encontrar y agrupar en clases los puntos de datos que tienen una alta similitud entre ellos. En los términos del algoritmo, esta similitud se entiende como lo opuesto de la distancia entre puntos de datos. Cuanto más cerca estén los puntos de datos, más similares y con más probabilidades de pertenecer al mismo clúster serán • El agrupamiento se realiza minimizando la suma de distancias entre cada objeto y el centroide (o baricentro) de su grupo o cluster • En el tema 6 profundizaremos en la implementación y formulación matemática del algoritmo https://youtu.be/EZOab1vkFmI
  • 10. Algoritmos Clusterización Jerárquica 10 • La Agrupación jerárquica es una alternativa a otros algoritmos de agrupación. La principal ventaja de la agrupación jerárquica es que no necesitamos especificar el número de agrupaciones, la encontrará por sí misma. • Además, permite el trazado de dendogramas. Los dendogramas son visualizaciones de una agrupación jerárquica binaria. Las observaciones que se fusionan en la parte inferior son similares, mientras que las que están en la parte superior son muy diferentes. Con los dendogramas, las conclusiones se hacen basándose en la ubicación del eje vertical y no en el horizontal. • Existen dos enfoques para este tipo de agrupación: aglomerativo y divisivo • Divisivo: comienza por englobar todos los puntos de datos en un solo grupo. Luego, dividirá el grupo iterativamente en otros más pequeños hasta que cada uno de ellos contenga sólo una muestra • Aglomerativo: comienza con cada muestra siendo un grupo diferente y luego fusionándolas por las que están más cerca unas de otras hasta que sólo haya un grupo https://youtu.be/T76paW6fJBI Representación en Dendograma
  • 11. Algoritmos Asociación 11 • Un algoritmo de asociación es un método basado en reglas para detectar relaciones entre variables en un conjunto de datos determinado • Estos métodos se utilizan con frecuencia para análisis de cesta de la compra, que permiten a las empresas comprender mejor las relaciones entre los diferentes productos. Entender los hábitos de consumo de los clientes permite a las empresas desarrollar mejores estrategias de venta cruzada y motores de recomendaciones • Ejemplos como: "Los clientes que compraron este artículo también compraron" de Amazon o la lista "Descubrimiento semanal" de Spotify • Incluyen diferentes algoritmos para generar reglas de asociación, como Apriori, Eclat y FP-Growth • El algoritmo Apriori es el más utilizado. Se han popularizado en los análisis de cesta de la compra, que generan diferentes motores de recomendaciones para plataformas de música y comercios en línea. Se utilizan dentro de conjuntos de datos transaccionales para identificar conjuntos de elementos frecuentes, o colecciones de elementos, para identificar la probabilidad de consumir un producto dado el consumo de otro producto. A continuación podéis encontrar un ejemplo del funcionamiento
  • 12. Algoritmo Apriori 12 • Ejemplo aplicación del algoritmo Apriori en la propensión de compra. Podéis ver también materiales extra específicos del algoritmo en la plataforma del Aula • Vamos a analizar la asociación del ejemplo: los que compran harina y huevo, también compran leche • Conceptos clave del algoritmo: soporte, confianza, elevación y convicción https://view.genial.ly/5eb9403d7792c20d16619258/dossier-apriori-funcionnamiento
  • 13. Algoritmos de Reducción de dimensionalidad 13 • La reducción de la dimensionalidad es una técnica utilizada cuando el número de características, o dimensiones, de un determinado conjunto de datos es demasiado elevado. Reduce el número de entradas de datos a un tamaño gestionable, además de preservar la integridad del conjunto de datos lo máximo posible • Se usa comúnmente en la fase de preprocesamiento de datos, y existen varios métodos de reducción de dimensionalidad: ü Análisis de componentes principales (o PCA): Este método utiliza una transformación lineal para crear una nueva representación de datos, dando como resultado un conjunto de componentes principales ü Descomposición en valores singulares: La descomposición en valores singulares (SVD, por sus siglas en inglés) es otro enfoque a la reducción de dimensionalidad que factoriza una matriz, A, en tres matrices de rango inferior. SVD se denota mediante la fórmula A = USVT, donde U y V son matrices ortogonales. S es una matriz diagonal y los valores de S se consideran valores singulares de la matriz A. Similar a PCA, se suele utilizar para reducir el ruido y comprimir datos, como archivos de imágenes ü Codificadores automáticos (redes neuronales): para comprimir los datos y luego volver a crear una nueva representación de la entrada de datos original
  • 14. Algoritmo PCA 14 • La intuición detrás del Algoritmo PCA es la siguiente. Imaginemos por ejemplo que queremos predecir los precios de alquiler de vivienda del mercado. Tendremos en cuenta muchas variables diversas como: tipo de vivienda, tamaño de la vivienda, antigüedad, servicios, habitaciones, con/sin jardín, con/sin piscina, con/sin muebles; pero también podemos tener en cuenta la distancia al centro, si hay colegio en las cercanías, o supermercados, si es un entorno ruidoso, si tiene autopistas en las cercanías, la “seguridad del barrio”, si se aceptan mascotas, tiene wifi, tiene garaje, trastero… y seguir sumando variables • Es posible que cuanta más (y mejor) información, obtengamos una predicción más acertada. Pero también empezaremos a notar que la ejecución de los algoritmos (regresión lineal, redes neuronales, etc) es menos eficiente • Es posible que algunas de las variables sean menos importantes y no aporten demasiado valor a la predicción. También podríamos generar overfitting • Veremos también en este Tema 5 un ejemplo aplicado al reconocimiento de imágenes faciales. PCA como paso previo de un algoritmo supervisado de clasificación SVM. Es habitual este uso combinado de algoritmos de machine learning
  • 15. Algoritmo PCA 15 • El algoritmo de Análisis de Componentes Principales (PCA o Principal Component Analysis) es una técnica de Extracción de Características donde combinamos las entradas de una manera específica y podemos eliminar algunas de las variables menos importantes manteniendo la parte más importante . Además, luego de aplicar PCA conseguiremos que todas las nuevas variables sean independientes una de otra (ortogonales) • El método numérico consiste en: • Estandarizar los datos de entrada (normalización de las variables) • Obtener los vectores y valores propios principales de la matriz de covarianza • Ordenar los valores propios de mayor a menor y elegir los k vectores que se correspondan con los valores propios k más grandes (donde k es el número de dimensiones del nuevo subespacio de características) • Construir la matriz de proyección (o cambio de base) W con los k vectores propios seleccionados • Transformamos el dataset original X estandarizado vía W para obtener las nuevas características k- dimensionales • Podemos utilizar las librerías scikit-learn para la implementación práctica en Python, como veremos a continuación
  • 16. Implementación Algoritmo PCA 16 • Vamos a ver el uso de PCA en el preproceso de los datos en un problema de reconocimiento facial • En el caso práctico, utilizamos la base de datos Labeled Faces in the Wild • Importamos los datos en arrays de numpy http://vis-www.cs.umass.edu/lfw/
  • 18. Implementación Algoritmo PCA 18 • Dividimos de la forma habitual (ver Tema 2) en los proyectos de aprendizaje automático la base de datos en train y test (25%) • Aplicamos PCA con la base de datos de imágenes faciales, sin utilizar las etiquetas (aprendizaje no-supervisado). El objetivo es reducir la dimensión
  • 19. Implementación Algoritmo PCA + Clasificación SVM 19 • Si queremos terminar el proceso de aprendizaje automático para clasificar imágenes nuevas a partir del dataset preprocesado, el siguiente paso es entrenar un modelo de clasificación. Vamos a utilizar para este ejemplo un modelo supervisado del Tema 2: Suport Vector Machine o SVM (de la librería scikit-learn) • Comentar que los problemas de reconocimiento de imágenes suelen resolverse también mediante algoritmos de aprendizaje automático basados en redes neuronales convolucionales. Las podéis encontrar en librerías como pytorch o tensorflow mencionadas en el Tema 1 • Un ejemplo de la librería tensorflow: https://www.tensorflow.org/tutorials/keras/classification?hl=es-419
  • 20. Implementación Algoritmo PCA + Clasificación SVM 20 • Evaluación del performance del modelo sobre los datos test:
  • 21. Sede Universitat Carlemany Av. Verge de Canòlich, 47 AD600 Sant Julià de Lòria Principat d’Andorra Linkedin Facebook +376 878 300