SlideShare una empresa de Scribd logo
Aprendizaje automático I
ODS 12, 13
Tema 2: Un primer caso práctico
2
Aprendizaje automático
3
• En este apartado, vamos a ver un primer ejemplo sencillo de aprendizaje automático o machine learning.
Introduciremos los conceptos básicos y crearemos un primer modelo
• Un botánico quiere identificar la especie de flor de iris entre una muestra de flores que ha recogido. Dispone
de medidas que ha tomado de cada flor a analizar: la longitud y ancho de los pétalos y los sépalos
• Además, tenemos también una base de datos de varias flores de iris, con sus medidas, y la especie concreta a
la que pertenecen: setosa, versicolor y virginica
• El objetivo es construir un primer modelo de machine learning que pueda aprender de la muestra de flores ya
identificadas de la base de datos, y que luego nos permita predecir la especie correspondiente de una nueva
flor de iris encontrada
Pétalo
Sépalo
Base de Datos Iris
4
• Tenemos una base de datos de varias flores de iris, con sus medidas, y la especie concreta a la que pertenecen: setosa,
versicolor y virginica. En los siguientes enlaces podéis encontrar información añadida sobre este dataset
https://en.wikipedia.org/wiki/Iris_flower_data_set
https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html#
Bases de Datos
5
• Existen bases de datos abiertas para realizar prácticas de algoritmos de aprendizaje automático en muchos ámbitos de aplicación
http://archive.ics.uci.edu/ml/datasets.php
Base de Datos Iris: muestra con características
6
• La función load_iris()
devuelve un objeto bunch
con los datos: claves y
atributos
• Un objeto o estructura de
datos bunch es similar a un
diccionario (claves y
atributos para los
elementos). Añade la
posibilidad de acceder a los
valores con las claves
• Utilizaremos la base de datos Iris dataset, que se encuentra en la librería scikit-learn, en el módulo de bases de datos
• Podemos ver las claves de la base de datos, los nombres de las especies a clasificar, las características de cada muestra de flor, y
ejemplos númericos de valores de estas características para cinco flores de la base de datos
• La base de datos, en el array data contiene las medidas de 150 flores iris. Cada observación o flor individual se llama una muestra
en machine learning, y las propiedades son las características
Base de Datos Iris: etiquetas
7
• Las etiquetas (o target) con el nombre de la especie de cada flor son un array de la base de datos
• Las especies de flores están codificadas con los números 0 (setosa), 1 (versicolor) y 2 (virginica)
Base de Datos Iris: datos de training y testing
8
• Nuestro objetivo es ahora construir un modelo de aprendizaje automático o machine learning que nos permita predecir o
clasificar una flor nueva recogida, a partir de las medidas observadas (sus características)
• En todos los problemas de aprendizaje automático,
dividiremos primero la base de datos conocidos en dos: los
datos de entrenamiento o training, y los datos de verificación
o testing
• Construiremos (entrenaremos) el modelo a partir de la parte
de datos de training
• Utilizaremos el restos de datos, los datos de testing, para
comprobar que nuestro modelo realmente funciona, tiene
capacidad de predecir en nuevos casos
• Queremos que los modelos no consistan sólo en memorizar
los casos conocidos y repetirlos, sinó que sean capaces de
generalizar con nuevos datos
• Por esta razón, dividimos los datos en estos dos grupos en el
proceso de construir el modelo
Pétalo
Sépalo
Muestras
(observaciones,
instancias)
Características (atributos, medidas,
dimensiones)
Etiquetas
Base de Datos Iris: datos de training y testing
9
• Podemos separar los datos en dos partes de training y testing de manera aleatoria utilizando la función de scikit-learn
• Es habitual, por ejemplo, dedicar un 75% de los datos al entrenamiento o aprendizaje del modelo, y el 25% restante al
testing o verificación
• Los datos con las medidas los denotaremos con la letra X (en mayúsculas), mientras que las etiquetas las denotamos
con y (minúscula). Es la formulación matemática habitual de y=f(x)
• Utilizamos X en mayúscula por ser una matriz (array de varias dimensiones), como también es habitual en matemáticas
• Observar que la variable random_state=0 asigna el una semilla constante 0 a la partición aleatoria. Es decir, garantiza
en este caso la misma partición si ejecutamos el programa varias veces
Base de Datos Iris: visualización
10
• En los proyectos de aprendizaje automático, es buena práctica analizar los datos antes de utilizar los modelos,
con el objetivo de tener mejor comprensión de éstos
• Vamos a visualizar los datos con funciones gráficas
• Utilizaremos gráficos de dispersión, con dos características representadas en cada punto. Y una matriz con cada
gráfico resultante de combinar las distintas características a pares. Y un color distinto para cada una de las tres
especies
• Rellenamos la diagonal con información añadida correspondiente al histograma de frecuencias en la muestra
de datos de cada característica
Base de Datos Iris: visualización
11
• Observando los datos, parece que las características
(las medidas almacenadas) pueden servir para
determinar o clasificar las flores en cada especie
Modelo de aprendizaje automático: algoritmo kNN
12
• A continuación, vamos a construir un modelo de machine learning para este problema. Existen muchos
algoritmos de clasificación en la librería scikit-learn y que veremos a lo largo del curso
• Para este caso práctico, podemos escoger el algoritmo kNN o k-Nearest Neighbor
• La idea del modelo kNN es muy sencilla: para clasificar una nueva muestra u observación (una flor), el
algoritmo encuentra el elemento más cercano en la base de datos. Y asigna la etiqueta (la clasificación) de
éste al nuevo elemento
• Más adelante en el curso, revisitaremos este modelo con más detalle. kNN utiliza k puntos vecinos en el
entrenamiento (por ejemplo, tres o cinco puntos vecinos). A partir de estos, hacemos la predicción para el
nuevo punto considerando la clase o etiqueta mayoritaria entre este grupo de puntos vecinos
Ejemplos en Finanzas: el algoritmo kNN también se ha utilizado en una variedad de casos de uso económico
y financiero. A continuación podéis encontrar dos casos prácticos relacionados con el riesgo crediticio o de
solvencia de empresas, para profundizar:
https://iopscience.iop.org/article/10.1088/1742-6596/1025/1/012114/pdf
https://www.ijera.com/papers/Vol3_issue5/DI35605610.pdf
Modelo de aprendizaje automático: entrenamiento algoritmo
13
• Utilizamos pues el algoritmo kNN en scikit-learn
• Está implementado como una clase de objeto KNeighborsClassifier
• Cuando utilizamos estos objetos, el algoritmos encapsula en sus atributos y métodos (funciones) toda la
información que necesitamos. Por ejemplo, el método fit del objeto kNN nos permite construir el modelo
a partir de los datos de entrenamiento (X_train, y_train)
• Ahora ya tenemos el modelo de aprendizaje automático entrenado. Está listo para ser utilizado para
realizar predicciones como siguiente paso
Modelo de aprendizaje automático: predicción kNN
14
• Vamos ahora a realizar predicciones para nuevos datos observados (nuevas flores) de los cuales no
tenemos la etiqueta (la especie de la flor)
• Supongamos que hemos encontrado una nueva flor de iris, con un sépalo con medidas: longitud 5cm, y
ancho 2,9cm, y pétalo: longitud 1cm y ancho 0,2cm
• ¿A qué especie pertenece la flor?
• El modelo predice que la nueva flor es de la clase 0, que corresponde a la especie setosa
Modelo de aprendizaje automático: evaluación
15
• El último paso en nuestro modelo de aprendizaje automático es verificar o evaluar el buen funcionamiento
del modelo construido. Nos preguntamos: ¿Ha clasificado correctamente la nueva flor?
• En general, para evaluar un modelo entrenado, utilizaremos los datos de test, comparando la predicción
con estos del modelo con su etiqueta (conocida en estos datos de test)
• Podemos calcular el porcentaje de acierto o precisión
• Observamos que en este ejemplo la precisión del modelo de aprendizaje es del 97%!!
Resumen de las fases del proyecto de ML
16
• Recapitulando, podemos resumir gráficamente un proyecto de aprendizaje automático en estas fases:
Tema 2: Ejercicios
• Ejercicio: consideramos el código siguiente. Comentar los pasos del modelo de aprendizaje automático
utilizando los conceptos estudiados en el Tema 2
• Podéis también repasar el funcionamiento del modelo kNN en el siguiente enlace:
https://youtu.be/FpAu0q2eSHo
Sede Universitat Carlemany
Av. Verge de Canòlich, 47
AD600 Sant Julià de Lòria
Principat d’Andorra
Linkedin Facebook
+376 878 300

Más contenido relacionado

Similar a Aprendizaje automático I - Sesión 2 Caso Práctico.pdf

TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
TestingAR Meetup
 
Algoritmos Aprendizaje Automático.2012
Algoritmos Aprendizaje Automático.2012Algoritmos Aprendizaje Automático.2012
Algoritmos Aprendizaje Automático.2012
Guillermo Santos
 
Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015
Eduardo Castro
 
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdfAprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Gerard Alba
 
Diagrama de Clases y Diagrama de Paquetes
Diagrama de Clases y Diagrama de PaquetesDiagrama de Clases y Diagrama de Paquetes
Diagrama de Clases y Diagrama de Paquetes
Charly410064
 
Prediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdfPrediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdf
Maribel Rosario Mija Torres
 
2 como simular
2 como simular2 como simular
2 como simulardantori
 
simulacion-compartido.pdf
simulacion-compartido.pdfsimulacion-compartido.pdf
simulacion-compartido.pdf
GenyferAldanaSalgado1
 
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOAPRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
systemprisoners
 
REDES NEURONALES.pptx
REDES NEURONALES.pptxREDES NEURONALES.pptx
REDES NEURONALES.pptx
AlexMollehuanca
 
Probabilidad
ProbabilidadProbabilidad
Probabilidad
Maestros en Linea MX
 
T1-AprendizajeAutomatico.pdf
T1-AprendizajeAutomatico.pdfT1-AprendizajeAutomatico.pdf
T1-AprendizajeAutomatico.pdf
Sebastianrojas563647
 
ALP Unidad 3: Tipos de datos estructurados y punteros
ALP Unidad 3: Tipos de datos estructurados y punterosALP Unidad 3: Tipos de datos estructurados y punteros
ALP Unidad 3: Tipos de datos estructurados y punteros
Franklin Parrales Bravo
 
Spss Tutorial 1
Spss Tutorial 1Spss Tutorial 1
Spss Tutorial 1vinod
 
Unidad 1, 2 y_3_algoritmos
Unidad 1, 2 y_3_algoritmosUnidad 1, 2 y_3_algoritmos
Unidad 1, 2 y_3_algoritmosGrisell d?z
 
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Gerard Alba
 
Taller crystal ball raphael rey tovar
Taller crystal ball raphael rey tovarTaller crystal ball raphael rey tovar
Taller crystal ball raphael rey tovar
Universidad de Lima
 
02401 04-509376nomivkzutz
02401 04-509376nomivkzutz02401 04-509376nomivkzutz
02401 04-509376nomivkzutz
giomar_alvarezc
 

Similar a Aprendizaje automático I - Sesión 2 Caso Práctico.pdf (20)

TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
TestingAR Meetup VIII - Luis Argerich - Una Breve Introducción a Machine Lear...
 
Algoritmos Aprendizaje Automático.2012
Algoritmos Aprendizaje Automático.2012Algoritmos Aprendizaje Automático.2012
Algoritmos Aprendizaje Automático.2012
 
Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015
 
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdfAprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
 
Diagrama de Clases y Diagrama de Paquetes
Diagrama de Clases y Diagrama de PaquetesDiagrama de Clases y Diagrama de Paquetes
Diagrama de Clases y Diagrama de Paquetes
 
Prediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdfPrediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdf
 
2 como simular
2 como simular2 como simular
2 como simular
 
simulacion-compartido.pdf
simulacion-compartido.pdfsimulacion-compartido.pdf
simulacion-compartido.pdf
 
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOAPRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
 
REDES NEURONALES.pptx
REDES NEURONALES.pptxREDES NEURONALES.pptx
REDES NEURONALES.pptx
 
Probabilidad
ProbabilidadProbabilidad
Probabilidad
 
T1-AprendizajeAutomatico.pdf
T1-AprendizajeAutomatico.pdfT1-AprendizajeAutomatico.pdf
T1-AprendizajeAutomatico.pdf
 
ALP Unidad 3: Tipos de datos estructurados y punteros
ALP Unidad 3: Tipos de datos estructurados y punterosALP Unidad 3: Tipos de datos estructurados y punteros
ALP Unidad 3: Tipos de datos estructurados y punteros
 
Módulo 2
Módulo 2Módulo 2
Módulo 2
 
Maple 10 para matemáticas básicas
Maple 10 para matemáticas básicasMaple 10 para matemáticas básicas
Maple 10 para matemáticas básicas
 
Spss Tutorial 1
Spss Tutorial 1Spss Tutorial 1
Spss Tutorial 1
 
Unidad 1, 2 y_3_algoritmos
Unidad 1, 2 y_3_algoritmosUnidad 1, 2 y_3_algoritmos
Unidad 1, 2 y_3_algoritmos
 
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
 
Taller crystal ball raphael rey tovar
Taller crystal ball raphael rey tovarTaller crystal ball raphael rey tovar
Taller crystal ball raphael rey tovar
 
02401 04-509376nomivkzutz
02401 04-509376nomivkzutz02401 04-509376nomivkzutz
02401 04-509376nomivkzutz
 

Más de Gerard Alba

TV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdfTV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdf
Gerard Alba
 
Module3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdfModule3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdf
Gerard Alba
 
Module1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdfModule1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdf
Gerard Alba
 
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdfAprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Gerard Alba
 
Aprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdfAprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdf
Gerard Alba
 
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptxAlgoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Gerard Alba
 
Master class Fintech
Master class FintechMaster class Fintech
Master class Fintech
Gerard Alba
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414
Gerard Alba
 
EFPA ESG Advisor - summary
EFPA ESG Advisor - summaryEFPA ESG Advisor - summary
EFPA ESG Advisor - summary
Gerard Alba
 
Gestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - RoboadvisorsGestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - Roboadvisors
Gerard Alba
 
Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524
Gerard Alba
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
Gerard Alba
 
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Gerard Alba
 
Specialized Functions in Finance 201605
Specialized Functions in Finance 201605Specialized Functions in Finance 201605
Specialized Functions in Finance 201605
Gerard Alba
 
ANDBANK Microfinance Fund
ANDBANK Microfinance FundANDBANK Microfinance Fund
ANDBANK Microfinance Fund
Gerard Alba
 
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
Gerard Alba
 
Plan pensiones Andbank
Plan pensiones AndbankPlan pensiones Andbank
Plan pensiones Andbank
Gerard Alba
 
Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403Gerard Alba
 
Fondos Andbank UCITS, Valencia 201403
Fondos Andbank UCITS, Valencia 201403Fondos Andbank UCITS, Valencia 201403
Fondos Andbank UCITS, Valencia 201403
Gerard Alba
 
Volatility models and their applications in Finance (4/4) - Handouts: Volatil...
Volatility models and their applications in Finance (4/4) - Handouts: Volatil...Volatility models and their applications in Finance (4/4) - Handouts: Volatil...
Volatility models and their applications in Finance (4/4) - Handouts: Volatil...
Gerard Alba
 

Más de Gerard Alba (20)

TV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdfTV2 - OOAD Case Study- Flight Systems.pdf
TV2 - OOAD Case Study- Flight Systems.pdf
 
Module3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdfModule3 - Object Oriented Analysis & Functional Model.pdf
Module3 - Object Oriented Analysis & Functional Model.pdf
 
Module1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdfModule1 - Introduction to Software Engineering.pdf
Module1 - Introduction to Software Engineering.pdf
 
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdfAprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
Aprendizaje automático I - Tema 6 Aprendizaje Automático K-Means.pdf
 
Aprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdfAprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdf
 
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptxAlgoritmos y Estructuras de Datos I - Sesión 1.pptx
Algoritmos y Estructuras de Datos I - Sesión 1.pptx
 
Master class Fintech
Master class FintechMaster class Fintech
Master class Fintech
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414
 
EFPA ESG Advisor - summary
EFPA ESG Advisor - summaryEFPA ESG Advisor - summary
EFPA ESG Advisor - summary
 
Gestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - RoboadvisorsGestión de Carteras Óptimas - Roboadvisors
Gestión de Carteras Óptimas - Roboadvisors
 
Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524Agenda lecture GA PETD digital transformation financial services 20190524
Agenda lecture GA PETD digital transformation financial services 20190524
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
 
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
Cinquanta anys d'Star Trek: un futur amb tipus d'interès negatius ja no és ci...
 
Specialized Functions in Finance 201605
Specialized Functions in Finance 201605Specialized Functions in Finance 201605
Specialized Functions in Finance 201605
 
ANDBANK Microfinance Fund
ANDBANK Microfinance FundANDBANK Microfinance Fund
ANDBANK Microfinance Fund
 
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
2015 July 1st: launching of Sigma-Andbank European Equities for Israel investors
 
Plan pensiones Andbank
Plan pensiones AndbankPlan pensiones Andbank
Plan pensiones Andbank
 
Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403Andbank Funds UCITS - Flexible Allocation 201403
Andbank Funds UCITS - Flexible Allocation 201403
 
Fondos Andbank UCITS, Valencia 201403
Fondos Andbank UCITS, Valencia 201403Fondos Andbank UCITS, Valencia 201403
Fondos Andbank UCITS, Valencia 201403
 
Volatility models and their applications in Finance (4/4) - Handouts: Volatil...
Volatility models and their applications in Finance (4/4) - Handouts: Volatil...Volatility models and their applications in Finance (4/4) - Handouts: Volatil...
Volatility models and their applications in Finance (4/4) - Handouts: Volatil...
 

Último

Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
AlejandraCasallas7
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
rafaelsalazar0615
 
biogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectosbiogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectos
Luis Enrique Zafra Haro
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
CrystalRomero18
 
leidy fuentes - power point -expocccion -unidad 4 (1).pptx
leidy fuentes - power point -expocccion -unidad 4 (1).pptxleidy fuentes - power point -expocccion -unidad 4 (1).pptx
leidy fuentes - power point -expocccion -unidad 4 (1).pptx
Leidyfuentes19
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
DanielErazoMedina
 
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Telefónica
 
Ventajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloroVentajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloro
durangense277
 
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfTRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
thomasdcroz38
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 
proyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmusproyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmus
raquelariza02
 
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
sarasofiamontezuma
 
Conceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. TecnologíaConceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. Tecnología
coloradxmaria
 
Diagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestreDiagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestre
DiegoCampos433849
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
ItsSofi
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
CesarPazosQuispe
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
cristianrb0324
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
cdraco
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
JulyMuoz18
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 

Último (20)

Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
 
Diagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestreDiagrama de flujo soporte técnico 5to semestre
Diagrama de flujo soporte técnico 5to semestre
 
biogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectosbiogas industrial para guiarse en proyectos
biogas industrial para guiarse en proyectos
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
 
leidy fuentes - power point -expocccion -unidad 4 (1).pptx
leidy fuentes - power point -expocccion -unidad 4 (1).pptxleidy fuentes - power point -expocccion -unidad 4 (1).pptx
leidy fuentes - power point -expocccion -unidad 4 (1).pptx
 
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
ACTIVIDAD DE TECNOLOGÍA AÑO LECTIVO 2024
 
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...
 
Ventajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloroVentajas y desventajas de la desinfección con cloro
Ventajas y desventajas de la desinfección con cloro
 
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfTRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
proyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmusproyecto invernadero desde el departamento de tecnología para Erasmus
proyecto invernadero desde el departamento de tecnología para Erasmus
 
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
 
Conceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. TecnologíaConceptos Básicos de Programación. Tecnología
Conceptos Básicos de Programación. Tecnología
 
Diagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestreDiagrama de flujo - ingenieria de sistemas 5to semestre
Diagrama de flujo - ingenieria de sistemas 5to semestre
 
Estructuras básicas_ conceptos básicos de programación.pdf
Estructuras básicas_  conceptos básicos de programación.pdfEstructuras básicas_  conceptos básicos de programación.pdf
Estructuras básicas_ conceptos básicos de programación.pdf
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 

Aprendizaje automático I - Sesión 2 Caso Práctico.pdf

  • 2. Tema 2: Un primer caso práctico 2
  • 3. Aprendizaje automático 3 • En este apartado, vamos a ver un primer ejemplo sencillo de aprendizaje automático o machine learning. Introduciremos los conceptos básicos y crearemos un primer modelo • Un botánico quiere identificar la especie de flor de iris entre una muestra de flores que ha recogido. Dispone de medidas que ha tomado de cada flor a analizar: la longitud y ancho de los pétalos y los sépalos • Además, tenemos también una base de datos de varias flores de iris, con sus medidas, y la especie concreta a la que pertenecen: setosa, versicolor y virginica • El objetivo es construir un primer modelo de machine learning que pueda aprender de la muestra de flores ya identificadas de la base de datos, y que luego nos permita predecir la especie correspondiente de una nueva flor de iris encontrada Pétalo Sépalo
  • 4. Base de Datos Iris 4 • Tenemos una base de datos de varias flores de iris, con sus medidas, y la especie concreta a la que pertenecen: setosa, versicolor y virginica. En los siguientes enlaces podéis encontrar información añadida sobre este dataset https://en.wikipedia.org/wiki/Iris_flower_data_set https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html#
  • 5. Bases de Datos 5 • Existen bases de datos abiertas para realizar prácticas de algoritmos de aprendizaje automático en muchos ámbitos de aplicación http://archive.ics.uci.edu/ml/datasets.php
  • 6. Base de Datos Iris: muestra con características 6 • La función load_iris() devuelve un objeto bunch con los datos: claves y atributos • Un objeto o estructura de datos bunch es similar a un diccionario (claves y atributos para los elementos). Añade la posibilidad de acceder a los valores con las claves • Utilizaremos la base de datos Iris dataset, que se encuentra en la librería scikit-learn, en el módulo de bases de datos • Podemos ver las claves de la base de datos, los nombres de las especies a clasificar, las características de cada muestra de flor, y ejemplos númericos de valores de estas características para cinco flores de la base de datos • La base de datos, en el array data contiene las medidas de 150 flores iris. Cada observación o flor individual se llama una muestra en machine learning, y las propiedades son las características
  • 7. Base de Datos Iris: etiquetas 7 • Las etiquetas (o target) con el nombre de la especie de cada flor son un array de la base de datos • Las especies de flores están codificadas con los números 0 (setosa), 1 (versicolor) y 2 (virginica)
  • 8. Base de Datos Iris: datos de training y testing 8 • Nuestro objetivo es ahora construir un modelo de aprendizaje automático o machine learning que nos permita predecir o clasificar una flor nueva recogida, a partir de las medidas observadas (sus características) • En todos los problemas de aprendizaje automático, dividiremos primero la base de datos conocidos en dos: los datos de entrenamiento o training, y los datos de verificación o testing • Construiremos (entrenaremos) el modelo a partir de la parte de datos de training • Utilizaremos el restos de datos, los datos de testing, para comprobar que nuestro modelo realmente funciona, tiene capacidad de predecir en nuevos casos • Queremos que los modelos no consistan sólo en memorizar los casos conocidos y repetirlos, sinó que sean capaces de generalizar con nuevos datos • Por esta razón, dividimos los datos en estos dos grupos en el proceso de construir el modelo Pétalo Sépalo Muestras (observaciones, instancias) Características (atributos, medidas, dimensiones) Etiquetas
  • 9. Base de Datos Iris: datos de training y testing 9 • Podemos separar los datos en dos partes de training y testing de manera aleatoria utilizando la función de scikit-learn • Es habitual, por ejemplo, dedicar un 75% de los datos al entrenamiento o aprendizaje del modelo, y el 25% restante al testing o verificación • Los datos con las medidas los denotaremos con la letra X (en mayúsculas), mientras que las etiquetas las denotamos con y (minúscula). Es la formulación matemática habitual de y=f(x) • Utilizamos X en mayúscula por ser una matriz (array de varias dimensiones), como también es habitual en matemáticas • Observar que la variable random_state=0 asigna el una semilla constante 0 a la partición aleatoria. Es decir, garantiza en este caso la misma partición si ejecutamos el programa varias veces
  • 10. Base de Datos Iris: visualización 10 • En los proyectos de aprendizaje automático, es buena práctica analizar los datos antes de utilizar los modelos, con el objetivo de tener mejor comprensión de éstos • Vamos a visualizar los datos con funciones gráficas • Utilizaremos gráficos de dispersión, con dos características representadas en cada punto. Y una matriz con cada gráfico resultante de combinar las distintas características a pares. Y un color distinto para cada una de las tres especies • Rellenamos la diagonal con información añadida correspondiente al histograma de frecuencias en la muestra de datos de cada característica
  • 11. Base de Datos Iris: visualización 11 • Observando los datos, parece que las características (las medidas almacenadas) pueden servir para determinar o clasificar las flores en cada especie
  • 12. Modelo de aprendizaje automático: algoritmo kNN 12 • A continuación, vamos a construir un modelo de machine learning para este problema. Existen muchos algoritmos de clasificación en la librería scikit-learn y que veremos a lo largo del curso • Para este caso práctico, podemos escoger el algoritmo kNN o k-Nearest Neighbor • La idea del modelo kNN es muy sencilla: para clasificar una nueva muestra u observación (una flor), el algoritmo encuentra el elemento más cercano en la base de datos. Y asigna la etiqueta (la clasificación) de éste al nuevo elemento • Más adelante en el curso, revisitaremos este modelo con más detalle. kNN utiliza k puntos vecinos en el entrenamiento (por ejemplo, tres o cinco puntos vecinos). A partir de estos, hacemos la predicción para el nuevo punto considerando la clase o etiqueta mayoritaria entre este grupo de puntos vecinos Ejemplos en Finanzas: el algoritmo kNN también se ha utilizado en una variedad de casos de uso económico y financiero. A continuación podéis encontrar dos casos prácticos relacionados con el riesgo crediticio o de solvencia de empresas, para profundizar: https://iopscience.iop.org/article/10.1088/1742-6596/1025/1/012114/pdf https://www.ijera.com/papers/Vol3_issue5/DI35605610.pdf
  • 13. Modelo de aprendizaje automático: entrenamiento algoritmo 13 • Utilizamos pues el algoritmo kNN en scikit-learn • Está implementado como una clase de objeto KNeighborsClassifier • Cuando utilizamos estos objetos, el algoritmos encapsula en sus atributos y métodos (funciones) toda la información que necesitamos. Por ejemplo, el método fit del objeto kNN nos permite construir el modelo a partir de los datos de entrenamiento (X_train, y_train) • Ahora ya tenemos el modelo de aprendizaje automático entrenado. Está listo para ser utilizado para realizar predicciones como siguiente paso
  • 14. Modelo de aprendizaje automático: predicción kNN 14 • Vamos ahora a realizar predicciones para nuevos datos observados (nuevas flores) de los cuales no tenemos la etiqueta (la especie de la flor) • Supongamos que hemos encontrado una nueva flor de iris, con un sépalo con medidas: longitud 5cm, y ancho 2,9cm, y pétalo: longitud 1cm y ancho 0,2cm • ¿A qué especie pertenece la flor? • El modelo predice que la nueva flor es de la clase 0, que corresponde a la especie setosa
  • 15. Modelo de aprendizaje automático: evaluación 15 • El último paso en nuestro modelo de aprendizaje automático es verificar o evaluar el buen funcionamiento del modelo construido. Nos preguntamos: ¿Ha clasificado correctamente la nueva flor? • En general, para evaluar un modelo entrenado, utilizaremos los datos de test, comparando la predicción con estos del modelo con su etiqueta (conocida en estos datos de test) • Podemos calcular el porcentaje de acierto o precisión • Observamos que en este ejemplo la precisión del modelo de aprendizaje es del 97%!!
  • 16. Resumen de las fases del proyecto de ML 16 • Recapitulando, podemos resumir gráficamente un proyecto de aprendizaje automático en estas fases:
  • 17. Tema 2: Ejercicios • Ejercicio: consideramos el código siguiente. Comentar los pasos del modelo de aprendizaje automático utilizando los conceptos estudiados en el Tema 2 • Podéis también repasar el funcionamiento del modelo kNN en el siguiente enlace: https://youtu.be/FpAu0q2eSHo
  • 18. Sede Universitat Carlemany Av. Verge de Canòlich, 47 AD600 Sant Julià de Lòria Principat d’Andorra Linkedin Facebook +376 878 300