SlideShare una empresa de Scribd logo
1 de 30
Descargar para leer sin conexión
Evaluación de hipótesis
Machine Learning
Estudiante
Paola Cárdenas
Universidad de Cuenca
Escuela de Ingeniería de Sistemas
Objetivo
Comparar los resultados que dan diferentes modelos
luego del entrenamiento para poder escoger el mejor
modelo a utlizar.
Contenido
● Comparación entre modelos
● Comparación de algoritmos de aprendizaje
○ Análisis ROC
● Ejemplo
Comparación
entre
modelos
Comparación entre modelos
Error
● Medida natural de rendimiento de un
clasifcador
● Tasa de error: proporción del número de errores
cometdos sobre un conjunto de instancias
Comparación entre modelos
Error de resubsttución
● Tasa de error calculada sobre el conjunto de
entrenamiento.
● Muy optmista. Estma tasas de error menores
que el error verdadero.
Comparación entre modelos
Validación de Modelos
Un modelo que puede sufrir de:
● Underfing (alto sesgo o bias) si el modelo es
demasiado simple.
● Overfing en los datos de entrenamiento (alta
varianza) si el modelo es demasiado complejo.
Comparación entre modelos
Comparación entre modelos
Validación de Modelos
Para encontrar un compromiso aceptable entre el
bias y la varianza tenemos las técnicas:
● cross-validaton
● holdout
● k-fold cross-validaton,
Estmaciones fables de error de generalización.
Comparación entre modelos
El método holdout (reserva)
● Dividir los datos originales en entrenamiento y
prueba.
● Típicamente 2/3 , 1/3 , de forma aleatoria.� �
● Estratfcación para muestras representatvas.
Comparación entre modelos
k-fold cross-validaton
En la validación cruzada k veces, dividimos
aleatoriamente el conjunto de datos de
entrenamiento en k sub-conjuntos sin reemplazo,
donde se usan k-1 para el entrenamiento modelo y
se usa 1 para la prueba.
k-fold cross-validaton
Comparación entre modelos
k-fold cross-validaton
Por lo general, utlizamos k-fold cross-validaton
para el ajuste del modelo, es decir, encontrar los
valores de hiperparámetro óptmos que producen
un rendimiento de generalización satsfactorio.
Comparación entre modelos
k-fold cross-validaton
Una vez encontrados valores de hiperparámetros
satsfactorios, se vuelve a entrenar el modelo en el
conjunto de entrenamiento completo y obtener una
estmación de rendimiento fnal utlizando el
conjunto de pruebas independiente.
Comparación entre modelos
Validación de Modelos
.
Comparación entre modelos
Se evaluan los modelos utlizando la precisión (accuracy)
del modelo, que es una medida útl para cuantfcar el
rendimiento de un modelo en general.
Sin embargo, hay otras métricas de rendimiento que se
pueden usar para medir la relevancia de un modelo,
como la precisión, la recuperación y el score-F1.
Comparación
algoritmos de
aprendizaje
Comparación algoritmos de aprendizaje
Comparar la precisión promedio de hipótesis producidas
por dos métodos distntos de aprendizaje es más difcil
dado que se debe promediar sobre múltples casos de
entrenamiento.
Comparación algoritmos de aprendizaje
Matriz de Confusión
Establece el rendimiento de
un algoritmo de aprendizaje.
● verdadero positvo,
● verdadero negatvo,
● falso positvo
● falso negatvo
predicciones de un
clasifcador
Análisis ROC
Análisis ROC
El Análisis ROC (Receiver operatng characteristcs) es
una metodología desarrollada para analizar un sistema
de decisión
El Análisis ROC trabaja con las nociones de Sensibilidad
y Especifcidad. (Valor predictvo positvo y Valor
predictvo negatvo)
Análisis ROC
El objetvo básico del Análisis ROC es dibujar la llamada
curva ROC e incluso calcular un área bajo dicha curva
La llamada AUC (Area Under Curve). Que es un valor
que va de 0 a 1
Curvas ROC
Característica operativa del receptor
La diagonal de un gráfco ROC se puede interpretar
como adivinar al azar, y los modelos de clasifcación que
se encuentran debajo de la diagonal se consideran
peores que las adivinanzas al azar.
Característica operativa del receptor
Un clasifcador perfecto caería en la esquina superior
izquierda del gráfco con una tasa positva verdadera de
1 y una tasa de falsos positvos de 0.
Sobre la base de la curva ROC, podemos calcular el área
bajo la curva (AUC) para caracterizar el rendimiento de
un modelo de clasifcación.
Ejemplo
Curvas ROC de
un dataset
evaluado con 4
algoritmos de
clasifcación.
Regresión
Logistca, Árbol
de decisión, Knn,
Majority Votng.
Fuentes
[1] Raschka, S., 2016. Python machine learning.
Community experience distlled. Packt Publishing,
Birmingham Mumbai.
[2] Curso de Estadístca. Jaume Llopis
Pérez.htps://estadistcaorquestainstrumento.wordpr
ess.com/2013/02/13/tema-23-analisis-roc/

Más contenido relacionado

La actualidad más candente

1.5 metodos iterativos
1.5 metodos iterativos1.5 metodos iterativos
1.5 metodos iterativosmorenito9001
 
Presentation on determination of size of sample (n)
Presentation on    determination of size of sample (n)Presentation on    determination of size of sample (n)
Presentation on determination of size of sample (n)Partnered Health
 
Metropolis-Hastings MCMC Short Tutorial
Metropolis-Hastings MCMC Short TutorialMetropolis-Hastings MCMC Short Tutorial
Metropolis-Hastings MCMC Short TutorialRalph Schlosser
 
Conceptos basicos y cuadros comparativos de prueba de hipotesis
Conceptos basicos y cuadros comparativos de prueba de hipotesisConceptos basicos y cuadros comparativos de prueba de hipotesis
Conceptos basicos y cuadros comparativos de prueba de hipotesisPao Aldaco
 
Statistical inference: Probability and Distribution
Statistical inference: Probability and DistributionStatistical inference: Probability and Distribution
Statistical inference: Probability and DistributionEugene Yan Ziyou
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.pptnicoals2
 
Pruebas de Hipótesis para dos medias y proporciones.estadistica
Pruebas de Hipótesis para dos medias y proporciones.estadisticaPruebas de Hipótesis para dos medias y proporciones.estadistica
Pruebas de Hipótesis para dos medias y proporciones.estadisticaYanina C.J
 
9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionalesANDREASEGURA30
 
Pruebas de Uniformidad
Pruebas de UniformidadPruebas de Uniformidad
Pruebas de UniformidadEwing Ma
 
Gráficos de control 2
Gráficos de control 2Gráficos de control 2
Gráficos de control 2Javier Chavez
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisvaro99
 

La actualidad más candente (20)

1.5 metodos iterativos
1.5 metodos iterativos1.5 metodos iterativos
1.5 metodos iterativos
 
Presentation on determination of size of sample (n)
Presentation on    determination of size of sample (n)Presentation on    determination of size of sample (n)
Presentation on determination of size of sample (n)
 
Metropolis-Hastings MCMC Short Tutorial
Metropolis-Hastings MCMC Short TutorialMetropolis-Hastings MCMC Short Tutorial
Metropolis-Hastings MCMC Short Tutorial
 
Pruebas de hipótesis
Pruebas de hipótesisPruebas de hipótesis
Pruebas de hipótesis
 
Conceptos basicos y cuadros comparativos de prueba de hipotesis
Conceptos basicos y cuadros comparativos de prueba de hipotesisConceptos basicos y cuadros comparativos de prueba de hipotesis
Conceptos basicos y cuadros comparativos de prueba de hipotesis
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Statistical inference: Probability and Distribution
Statistical inference: Probability and DistributionStatistical inference: Probability and Distribution
Statistical inference: Probability and Distribution
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.ppt
 
Spline cubico
Spline cubicoSpline cubico
Spline cubico
 
Pruebas de Hipótesis
Pruebas de HipótesisPruebas de Hipótesis
Pruebas de Hipótesis
 
Pruebas de Hipótesis para dos medias y proporciones.estadistica
Pruebas de Hipótesis para dos medias y proporciones.estadisticaPruebas de Hipótesis para dos medias y proporciones.estadistica
Pruebas de Hipótesis para dos medias y proporciones.estadistica
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
T student 2
T student 2T student 2
T student 2
 
9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionales
 
Info stat
Info statInfo stat
Info stat
 
Prueba De Medias
Prueba De MediasPrueba De Medias
Prueba De Medias
 
Unidad 5 calculo
Unidad 5 calculoUnidad 5 calculo
Unidad 5 calculo
 
Pruebas de Uniformidad
Pruebas de UniformidadPruebas de Uniformidad
Pruebas de Uniformidad
 
Gráficos de control 2
Gráficos de control 2Gráficos de control 2
Gráficos de control 2
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 

Similar a Machine learning: evaluación de hipótesis

Creación de un modelo pls sem con smart pls y análsiis de resultados
Creación de un modelo pls sem con smart pls y análsiis de resultadosCreación de un modelo pls sem con smart pls y análsiis de resultados
Creación de un modelo pls sem con smart pls y análsiis de resultadosVasilica Maria Margalina
 
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdfAprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdfGerard Alba
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosSergio Valenzuela Mayer
 
Capacidad del proceso
Capacidad del procesoCapacidad del proceso
Capacidad del procesoJuan Medellin
 
Mi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logísticaMi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logísticaJOSE AHIAS LOPEZ PORTILLO
 
Simulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con PromodelSimulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con PromodelAlvaro Gil
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosSergio Valenzuela Mayer
 
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdfRETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdfThaliaRiosMartinez1
 
reglajes formula uno electre
reglajes formula uno electrereglajes formula uno electre
reglajes formula uno electreFco Javier Lucena
 
Taller # 3 Modelos de Colas y Simulación”.pdf
Taller # 3 Modelos de Colas y Simulación”.pdfTaller # 3 Modelos de Colas y Simulación”.pdf
Taller # 3 Modelos de Colas y Simulación”.pdfJuanPabloPea19
 
Practicar con weka.pptx
Practicar con weka.pptxPracticar con weka.pptx
Practicar con weka.pptxDarnelyC
 
03 gestión de pruebas de software diseño de casos de pruebas
03 gestión de pruebas de software   diseño de casos de pruebas03 gestión de pruebas de software   diseño de casos de pruebas
03 gestión de pruebas de software diseño de casos de pruebasAntonio Quiña
 

Similar a Machine learning: evaluación de hipótesis (20)

Creación de un modelo pls sem con smart pls y análsiis de resultados
Creación de un modelo pls sem con smart pls y análsiis de resultadosCreación de un modelo pls sem con smart pls y análsiis de resultados
Creación de un modelo pls sem con smart pls y análsiis de resultados
 
Path Analysis (Camino de Senderos)
Path Analysis (Camino de Senderos)Path Analysis (Camino de Senderos)
Path Analysis (Camino de Senderos)
 
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdfAprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
Aprendizaje automático I - Tema 3 Aprendizaje Automático Supervisado.pdf
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Capacidad del proceso
Capacidad del procesoCapacidad del proceso
Capacidad del proceso
 
Mi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logísticaMi primer modelo de clasificación utilizando regresión logística
Mi primer modelo de clasificación utilizando regresión logística
 
Simulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con PromodelSimulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con Promodel
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Informe Pasantías 2
Informe Pasantías 2Informe Pasantías 2
Informe Pasantías 2
 
Parameter Tuning
Parameter TuningParameter Tuning
Parameter Tuning
 
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdfRETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
 
reglajes formula uno electre
reglajes formula uno electrereglajes formula uno electre
reglajes formula uno electre
 
Calculo de cpk
Calculo de cpkCalculo de cpk
Calculo de cpk
 
Taller # 3 Modelos de Colas y Simulación”.pdf
Taller # 3 Modelos de Colas y Simulación”.pdfTaller # 3 Modelos de Colas y Simulación”.pdf
Taller # 3 Modelos de Colas y Simulación”.pdf
 
Modelos de Elección Discreta
Modelos de Elección DiscretaModelos de Elección Discreta
Modelos de Elección Discreta
 
Optimizacion 1
Optimizacion  1Optimizacion  1
Optimizacion 1
 
Practicar con weka.pptx
Practicar con weka.pptxPracticar con weka.pptx
Practicar con weka.pptx
 
TRABAJO FINAL R.pdf
TRABAJO FINAL R.pdfTRABAJO FINAL R.pdf
TRABAJO FINAL R.pdf
 
03 gestión de pruebas de software diseño de casos de pruebas
03 gestión de pruebas de software   diseño de casos de pruebas03 gestión de pruebas de software   diseño de casos de pruebas
03 gestión de pruebas de software diseño de casos de pruebas
 
8 planes de muestreo
8 planes de muestreo8 planes de muestreo
8 planes de muestreo
 

Más de Angel Vázquez Patiño

Valores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficasValores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficasAngel Vázquez Patiño
 
Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...Angel Vázquez Patiño
 
Diferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calorDiferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calorAngel Vázquez Patiño
 
Puntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO linealPuntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO linealAngel Vázquez Patiño
 
Métodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante seriesMétodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante seriesAngel Vázquez Patiño
 
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...Angel Vázquez Patiño
 
Problemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuacionesProblemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuacionesAngel Vázquez Patiño
 
Linealización de sistemas de primer orden
Linealización de sistemas de primer ordenLinealización de sistemas de primer orden
Linealización de sistemas de primer ordenAngel Vázquez Patiño
 
Fundamentos de Computación y Programación
Fundamentos de Computación y ProgramaciónFundamentos de Computación y Programación
Fundamentos de Computación y ProgramaciónAngel Vázquez Patiño
 
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...Angel Vázquez Patiño
 

Más de Angel Vázquez Patiño (20)

Funciones, límites y continuidad
Funciones, límites y continuidadFunciones, límites y continuidad
Funciones, límites y continuidad
 
Integral definida e integración
Integral definida e integraciónIntegral definida e integración
Integral definida e integración
 
Valores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficasValores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficas
 
Derivada y diferenciación
Derivada y diferenciaciónDerivada y diferenciación
Derivada y diferenciación
 
Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...
 
Diferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calorDiferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calor
 
Puntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO linealPuntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO lineal
 
La ecuación diferencial de Legendre
La ecuación diferencial de LegendreLa ecuación diferencial de Legendre
La ecuación diferencial de Legendre
 
Solución en series de y' = f(x,y)
Solución en series de y' = f(x,y)Solución en series de y' = f(x,y)
Solución en series de y' = f(x,y)
 
Métodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante seriesMétodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante series
 
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
 
Problemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuacionesProblemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuaciones
 
Linealización de sistemas de primer orden
Linealización de sistemas de primer ordenLinealización de sistemas de primer orden
Linealización de sistemas de primer orden
 
Sistemas de EDOs
Sistemas de EDOsSistemas de EDOs
Sistemas de EDOs
 
Método de la secante
Método de la secanteMétodo de la secante
Método de la secante
 
Iteraciones de punto fijo
Iteraciones de punto fijoIteraciones de punto fijo
Iteraciones de punto fijo
 
Objetos y variables en Python
Objetos y variables en PythonObjetos y variables en Python
Objetos y variables en Python
 
Definiciones de Error
Definiciones de ErrorDefiniciones de Error
Definiciones de Error
 
Fundamentos de Computación y Programación
Fundamentos de Computación y ProgramaciónFundamentos de Computación y Programación
Fundamentos de Computación y Programación
 
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
 

Último

Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxCristianCastro978067
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 

Último (20)

Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 

Machine learning: evaluación de hipótesis

  • 1. Evaluación de hipótesis Machine Learning Estudiante Paola Cárdenas Universidad de Cuenca Escuela de Ingeniería de Sistemas
  • 2. Objetivo Comparar los resultados que dan diferentes modelos luego del entrenamiento para poder escoger el mejor modelo a utlizar.
  • 3. Contenido ● Comparación entre modelos ● Comparación de algoritmos de aprendizaje ○ Análisis ROC ● Ejemplo
  • 5.
  • 6. Comparación entre modelos Error ● Medida natural de rendimiento de un clasifcador ● Tasa de error: proporción del número de errores cometdos sobre un conjunto de instancias
  • 7. Comparación entre modelos Error de resubsttución ● Tasa de error calculada sobre el conjunto de entrenamiento. ● Muy optmista. Estma tasas de error menores que el error verdadero.
  • 8. Comparación entre modelos Validación de Modelos Un modelo que puede sufrir de: ● Underfing (alto sesgo o bias) si el modelo es demasiado simple. ● Overfing en los datos de entrenamiento (alta varianza) si el modelo es demasiado complejo.
  • 10. Comparación entre modelos Validación de Modelos Para encontrar un compromiso aceptable entre el bias y la varianza tenemos las técnicas: ● cross-validaton ● holdout ● k-fold cross-validaton, Estmaciones fables de error de generalización.
  • 11. Comparación entre modelos El método holdout (reserva) ● Dividir los datos originales en entrenamiento y prueba. ● Típicamente 2/3 , 1/3 , de forma aleatoria.� � ● Estratfcación para muestras representatvas.
  • 12.
  • 13. Comparación entre modelos k-fold cross-validaton En la validación cruzada k veces, dividimos aleatoriamente el conjunto de datos de entrenamiento en k sub-conjuntos sin reemplazo, donde se usan k-1 para el entrenamiento modelo y se usa 1 para la prueba.
  • 15. Comparación entre modelos k-fold cross-validaton Por lo general, utlizamos k-fold cross-validaton para el ajuste del modelo, es decir, encontrar los valores de hiperparámetro óptmos que producen un rendimiento de generalización satsfactorio.
  • 16. Comparación entre modelos k-fold cross-validaton Una vez encontrados valores de hiperparámetros satsfactorios, se vuelve a entrenar el modelo en el conjunto de entrenamiento completo y obtener una estmación de rendimiento fnal utlizando el conjunto de pruebas independiente.
  • 18. Comparación entre modelos Se evaluan los modelos utlizando la precisión (accuracy) del modelo, que es una medida útl para cuantfcar el rendimiento de un modelo en general. Sin embargo, hay otras métricas de rendimiento que se pueden usar para medir la relevancia de un modelo, como la precisión, la recuperación y el score-F1.
  • 20. Comparación algoritmos de aprendizaje Comparar la precisión promedio de hipótesis producidas por dos métodos distntos de aprendizaje es más difcil dado que se debe promediar sobre múltples casos de entrenamiento.
  • 21. Comparación algoritmos de aprendizaje Matriz de Confusión Establece el rendimiento de un algoritmo de aprendizaje. ● verdadero positvo, ● verdadero negatvo, ● falso positvo ● falso negatvo predicciones de un clasifcador
  • 23. Análisis ROC El Análisis ROC (Receiver operatng characteristcs) es una metodología desarrollada para analizar un sistema de decisión El Análisis ROC trabaja con las nociones de Sensibilidad y Especifcidad. (Valor predictvo positvo y Valor predictvo negatvo)
  • 24. Análisis ROC El objetvo básico del Análisis ROC es dibujar la llamada curva ROC e incluso calcular un área bajo dicha curva La llamada AUC (Area Under Curve). Que es un valor que va de 0 a 1
  • 26. Característica operativa del receptor La diagonal de un gráfco ROC se puede interpretar como adivinar al azar, y los modelos de clasifcación que se encuentran debajo de la diagonal se consideran peores que las adivinanzas al azar.
  • 27. Característica operativa del receptor Un clasifcador perfecto caería en la esquina superior izquierda del gráfco con una tasa positva verdadera de 1 y una tasa de falsos positvos de 0. Sobre la base de la curva ROC, podemos calcular el área bajo la curva (AUC) para caracterizar el rendimiento de un modelo de clasifcación.
  • 29. Curvas ROC de un dataset evaluado con 4 algoritmos de clasifcación. Regresión Logistca, Árbol de decisión, Knn, Majority Votng.
  • 30. Fuentes [1] Raschka, S., 2016. Python machine learning. Community experience distlled. Packt Publishing, Birmingham Mumbai. [2] Curso de Estadístca. Jaume Llopis Pérez.htps://estadistcaorquestainstrumento.wordpr ess.com/2013/02/13/tema-23-analisis-roc/