SlideShare una empresa de Scribd logo
1 de 38
Descargar para leer sin conexión
Evaluación de Hipótesis
Machine Learning
Daniel Campoverde C.
Evaluación de Hipótesis
Tenemos un algoritmo de ML A.
La aplicación de A produce una hipótesis h tomada del conjunto de
hipótesis H.
¿Qué tan buena o qué tan mala es la hipótesis h?
Evaluación de Hipótesis
Si tenemos varias hipótesis:
h1, h2, h3...hn
¿Cuál es la mejor?
Evaluación de Hipótesis
Si tenemos varios algoritmos ML:
A1, A2, A3...An
¿Cuál es mejor para este problema? ¿Hay algo que aprender?
Medidas de rendimiento
Dependen del tipo de problema que se resuelve:
Clasificación
Regresión
Clustering
. . .
Medidas de rendimiento
Clasificación
Porcentajes:
“Tenemos 1000 datos de prueba; 900 se clasifican correctamente.”
Rendimiento: 90%
Medidas de rendimiento
Regresión
Error medio cuadrado:
1
n
n
i=1
(Yi − Yi)
2
Medidas de rendimiento
Clustering
Número de grupos esperados vs grupos obtenidos:
“Tenemos datos de prueba que contemplan 5 grupos distintos; se
obtienen 6 grupos”
5
6
∗ 100 = 80%
Medidas de rendimiento detalladas
Para una correcta evaluación, son necesarias otras métricas.
Medidas de rendimiento detalladas
¿Por qué?
Sistema de acceso biométrico
Huella correcta = acceso concedido
Huella incorrecta = acceso denegado
Figure 2: Huella dactilar
Medidas de rendimiento detalladas
¿Por qué?
Sistema de acceso biométrico
Falso negativo: Molesto, inconveniente
Falso positivo: Posiblemente catastrófico
Medidas de rendimiento detalladas
¿Por qué?
Sistema de acceso biométrico
Aplicamos algún algoritmo A de ML y obtenemos una hipótesis h1
Figure 3: Hipótesis 1
Medidas de rendimiento detalladas
¿Por qué?
Sistema de acceso biométrico
Aplicamos algún algoritmo A de ML y obtenemos una hipótesis h2
Figure 4: Hipótesis 2
Medidas de rendimiento detalladas
Verdaderos positivos (TPR)
Verdaderos negativos (TNR)
Falsos positivos (FPR)
Falsos negativos (FNR)
Característica operativa total (TOC)
Característica operativa del receptor (ROC)
ROC bajo la curva (AUC)
Métodos de evaluación
Holdout
N-fold cross validation
. . .
Métodos de evaluación
Holdout
Figure 5: Holdout
Métodos de evaluación
N-fold cross validation
Medidas de rendimiento detalladas
Razón de verdaderos positivos (TPR) - Sensibilidad
Cuantos datos positivos fueron correctamente identificados
TP = Número de verdaderos positivos
N = Número de datos de prueba totales
TPR =
TP
N
“Número de huellas que son validas y que son clasificadas
como validas”
Medidas de rendimiento detalladas
Razón de verdaderos negativos (TNR) - Especificidad
Cuantos datos negativos fueron correctamente identificados
TN = Número de verdaderos negativos
N = Número de datos de prueba totales
TPR =
TN
N
“Número de huellas que NO son validas y que son clasifi-
cadas como invalidas”
Medidas de rendimiento detalladas
Razón de falsos positivos (FPR)
Cuantos datos positivos fueron incorrectamente identificados
FP = Número de falsos positivos
N = Número de datos de prueba totales
FPR =
FP
N
=
1 − TN
N
“Número de huellas que NO son validas y que son clasifi-
cadas como validas”
Medidas de rendimiento detalladas
Razón de falsos negativos (FNR)
Cuantos datos negativos fueron incorrectamente identificados
FN = Número de falsos negativos
N = Número de datos de prueba totales
FPR =
FN
N
“Número de huellas que son validas y que son clasificadas
como invalidas”
Medidas de rendimiento detalladas
Error y Precisión
Error =
FP + FN
FP + FN + TP + TN
Precisión = 1 − Error
Exactitud =
TP
TP + FP
Medidas de rendimiento detalladas
Métricas para clasificación multi-clase
Generalizando estas métricas a clasificaciones de múltiples clases:
Precisión(micro) =
TP1 + ... + TPn
TP1 + ... + TPn + FP1 + ... + FPn
Precisión(macro) =
Precision1 + ... + Precisionn
n
Medidas de rendimiento detalladas
Matriz de confusión
Comparación matricial entre clases esperadas y obtenidas. Permite
una fácil evaluación visual.
Medidas de rendimiento detalladas
Matriz de confusión
Condiciones negativas y positivas
Medidas de rendimiento detalladas
Característica operativa del receptor (ROC)
El ROC es una gráfica de verdaderos positivos vs falsos positivos
que muestra la habilidad de diagnostico de un clasificador.
Característica operativa del receptor (ROC)
Diagonal de conjetura aleatoria.
Característica operativa del receptor (ROC)
Diagonal de conjetura aleatoria.
Característica operativa del receptor (ROC)
Datos de prueba = N = 200
100 Negativos y 100 Positivos
Hipótesis h1, h2, h3
Figure 12: Huella dactilar
Característica operativa del receptor (ROC)
Condiciones para h1
TP TN FP FN
63 72 28 37
Característica operativa del receptor (ROC)
Condiciones para h2
TP TN FP FN
77 23 77 23
Característica operativa del receptor (ROC)
Condiciones para h3
TP TN FP FN
24 12 88 76
Característica operativa del receptor (ROC)
Matrices de confusión para h1, h2 y h3
Figure 13: Matrices de confusión
Característica operativa del receptor (ROC)
ROC para h1, h2 y h3
Característica operativa del receptor (ROC)
Invertimos la hipótesis h3 para obtener h3’
Característica operativa del receptor - Área bajo la curva
(ROC AUC)
El Área bajo la curva de la ROC permite conocer la probabilidad de
que se favorezcan instancias positivas sobre instancias negativas.
A =
−∞
∞
TPR(T). − FPR(T)dT
Característica operativa del receptor - Área bajo la curva
(ROC AUC)
Recientemente questionado en el ambito de machine learning por
ser una medida ruidosa
Referencias
Jason Brownlee. 2013. “How to evaluate machine learning
algorithms”
Mahesh Kumar, Nitin R. Patel, James B. Orlin. 2002. “Clustering
Data with Measurement Errors”
Abu Mostafa et al. 2012. “Learning from data”
Sebastian Rashka. 2015. “Python Machine Learning”
David Page et al. “Evaluating Machine Learning Methods”
Hanczar, Blaise et al. 2010. “Small-sample precision of ROC-related
estimates, Bioinformatics”

Más contenido relacionado

La actualidad más candente (17)

Subconsultas
SubconsultasSubconsultas
Subconsultas
 
Materia operativa
Materia operativaMateria operativa
Materia operativa
 
Derivadas[1]
Derivadas[1]Derivadas[1]
Derivadas[1]
 
05. aceptación tema5
05. aceptación tema505. aceptación tema5
05. aceptación tema5
 
8
88
8
 
Interpretacion
InterpretacionInterpretacion
Interpretacion
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
Metodo voguel
Metodo voguelMetodo voguel
Metodo voguel
 
Resumen experimentallksj
Resumen experimentallksjResumen experimentallksj
Resumen experimentallksj
 
Método de aproximación de vogel algoritmos
Método de aproximación de vogel algoritmosMétodo de aproximación de vogel algoritmos
Método de aproximación de vogel algoritmos
 
10 estructuras de seleccion select case i-tema10
10 estructuras de seleccion select case i-tema1010 estructuras de seleccion select case i-tema10
10 estructuras de seleccion select case i-tema10
 
Muestreos por atributos
Muestreos por atributosMuestreos por atributos
Muestreos por atributos
 
Estructuras de seleccion o de decision i-tema9
Estructuras de seleccion o de decision i-tema9Estructuras de seleccion o de decision i-tema9
Estructuras de seleccion o de decision i-tema9
 
Método vogel
Método vogelMétodo vogel
Método vogel
 
Detective
DetectiveDetective
Detective
 
graficas de carta de control np y p
graficas de carta de control np y pgraficas de carta de control np y p
graficas de carta de control np y p
 
Aplicacion de la_derivada
Aplicacion de la_derivadaAplicacion de la_derivada
Aplicacion de la_derivada
 

Similar a Machine learning: evaluación de hipótesis

Similar a Machine learning: evaluación de hipótesis (20)

Teoria de la estimación
Teoria de la estimaciónTeoria de la estimación
Teoria de la estimación
 
Simulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con PromodelSimulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con Promodel
 
Chi cuadrado
Chi cuadradoChi cuadrado
Chi cuadrado
 
Chi cuadrado
Chi cuadradoChi cuadrado
Chi cuadrado
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Capítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultadosCapítulo 07 interpretación de resultados
Capítulo 07 interpretación de resultados
 
Maxima verosimilitud
Maxima verosimilitudMaxima verosimilitud
Maxima verosimilitud
 
Prueba de hipotesis v6 ok
Prueba de hipotesis v6 okPrueba de hipotesis v6 ok
Prueba de hipotesis v6 ok
 
Tema6 muestreo-aceptacion-atributos
Tema6 muestreo-aceptacion-atributosTema6 muestreo-aceptacion-atributos
Tema6 muestreo-aceptacion-atributos
 
Gerencia calidad total herramientas abc
Gerencia calidad total   herramientas abcGerencia calidad total   herramientas abc
Gerencia calidad total herramientas abc
 
Cap1.2001 2
Cap1.2001 2Cap1.2001 2
Cap1.2001 2
 
estadistica_inferencial.pdf
estadistica_inferencial.pdfestadistica_inferencial.pdf
estadistica_inferencial.pdf
 
Estadisticadocx
EstadisticadocxEstadisticadocx
Estadisticadocx
 
Simulacion con R
Simulacion con RSimulacion con R
Simulacion con R
 
CONTROL DE CALIDAD TODO LO QUE SE LLEVA EN UN SEMESTRE.pptx
CONTROL DE CALIDAD TODO LO QUE SE LLEVA EN UN SEMESTRE.pptxCONTROL DE CALIDAD TODO LO QUE SE LLEVA EN UN SEMESTRE.pptx
CONTROL DE CALIDAD TODO LO QUE SE LLEVA EN UN SEMESTRE.pptx
 
2 eficiencia
2 eficiencia2 eficiencia
2 eficiencia
 
Pruebas de hipótesis
Pruebas de hipótesisPruebas de hipótesis
Pruebas de hipótesis
 
Clase 2 - Errores.pdf
Clase 2 - Errores.pdfClase 2 - Errores.pdf
Clase 2 - Errores.pdf
 
Juan ruales estadistica
Juan ruales estadisticaJuan ruales estadistica
Juan ruales estadistica
 
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdfRETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
 

Más de Angel Vázquez Patiño

Valores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficasValores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficasAngel Vázquez Patiño
 
Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...Angel Vázquez Patiño
 
Diferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calorDiferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calorAngel Vázquez Patiño
 
Puntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO linealPuntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO linealAngel Vázquez Patiño
 
Métodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante seriesMétodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante seriesAngel Vázquez Patiño
 
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...Angel Vázquez Patiño
 
Problemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuacionesProblemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuacionesAngel Vázquez Patiño
 
Linealización de sistemas de primer orden
Linealización de sistemas de primer ordenLinealización de sistemas de primer orden
Linealización de sistemas de primer ordenAngel Vázquez Patiño
 
Fundamentos de Computación y Programación
Fundamentos de Computación y ProgramaciónFundamentos de Computación y Programación
Fundamentos de Computación y ProgramaciónAngel Vázquez Patiño
 
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...Angel Vázquez Patiño
 

Más de Angel Vázquez Patiño (20)

Funciones, límites y continuidad
Funciones, límites y continuidadFunciones, límites y continuidad
Funciones, límites y continuidad
 
Integral definida e integración
Integral definida e integraciónIntegral definida e integración
Integral definida e integración
 
Valores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficasValores extremos y comportamiento de las funciones y de sus gráficas
Valores extremos y comportamiento de las funciones y de sus gráficas
 
Derivada y diferenciación
Derivada y diferenciaciónDerivada y diferenciación
Derivada y diferenciación
 
Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...Causality and climate networks approaches for evaluating climate models, trac...
Causality and climate networks approaches for evaluating climate models, trac...
 
Diferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calorDiferencias finitas y Ecuación de calor
Diferencias finitas y Ecuación de calor
 
Puntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO linealPuntos ordinarios y singularidades de una EDO lineal
Puntos ordinarios y singularidades de una EDO lineal
 
La ecuación diferencial de Legendre
La ecuación diferencial de LegendreLa ecuación diferencial de Legendre
La ecuación diferencial de Legendre
 
Solución en series de y' = f(x,y)
Solución en series de y' = f(x,y)Solución en series de y' = f(x,y)
Solución en series de y' = f(x,y)
 
Métodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante seriesMétodos de resolución de EDOs mediante series
Métodos de resolución de EDOs mediante series
 
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
Solución en series de EDOs no lineales de orden mayor a uno y de un sistema d...
 
Problemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuacionesProblemas que originan sistemas de ecuaciones
Problemas que originan sistemas de ecuaciones
 
Linealización de sistemas de primer orden
Linealización de sistemas de primer ordenLinealización de sistemas de primer orden
Linealización de sistemas de primer orden
 
Sistemas de EDOs
Sistemas de EDOsSistemas de EDOs
Sistemas de EDOs
 
Método de la secante
Método de la secanteMétodo de la secante
Método de la secante
 
Iteraciones de punto fijo
Iteraciones de punto fijoIteraciones de punto fijo
Iteraciones de punto fijo
 
Objetos y variables en Python
Objetos y variables en PythonObjetos y variables en Python
Objetos y variables en Python
 
Definiciones de Error
Definiciones de ErrorDefiniciones de Error
Definiciones de Error
 
Fundamentos de Computación y Programación
Fundamentos de Computación y ProgramaciónFundamentos de Computación y Programación
Fundamentos de Computación y Programación
 
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
Causality Strength Signatures for Measuring GCMs Performance: The South Ameri...
 

Último

PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfJC Díaz Herrera
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Familias más ricas de AL por países (2024).pdf
Familias más ricas de AL por países (2024).pdfFamilias más ricas de AL por países (2024).pdf
Familias más ricas de AL por países (2024).pdfJC Díaz Herrera
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 

Último (20)

PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Familias más ricas de AL por países (2024).pdf
Familias más ricas de AL por países (2024).pdfFamilias más ricas de AL por países (2024).pdf
Familias más ricas de AL por países (2024).pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 

Machine learning: evaluación de hipótesis

  • 1. Evaluación de Hipótesis Machine Learning Daniel Campoverde C.
  • 2. Evaluación de Hipótesis Tenemos un algoritmo de ML A. La aplicación de A produce una hipótesis h tomada del conjunto de hipótesis H. ¿Qué tan buena o qué tan mala es la hipótesis h?
  • 3. Evaluación de Hipótesis Si tenemos varias hipótesis: h1, h2, h3...hn ¿Cuál es la mejor?
  • 4. Evaluación de Hipótesis Si tenemos varios algoritmos ML: A1, A2, A3...An ¿Cuál es mejor para este problema? ¿Hay algo que aprender?
  • 5. Medidas de rendimiento Dependen del tipo de problema que se resuelve: Clasificación Regresión Clustering . . .
  • 6. Medidas de rendimiento Clasificación Porcentajes: “Tenemos 1000 datos de prueba; 900 se clasifican correctamente.” Rendimiento: 90%
  • 7. Medidas de rendimiento Regresión Error medio cuadrado: 1 n n i=1 (Yi − Yi) 2
  • 8. Medidas de rendimiento Clustering Número de grupos esperados vs grupos obtenidos: “Tenemos datos de prueba que contemplan 5 grupos distintos; se obtienen 6 grupos” 5 6 ∗ 100 = 80%
  • 9. Medidas de rendimiento detalladas Para una correcta evaluación, son necesarias otras métricas.
  • 10. Medidas de rendimiento detalladas ¿Por qué? Sistema de acceso biométrico Huella correcta = acceso concedido Huella incorrecta = acceso denegado Figure 2: Huella dactilar
  • 11. Medidas de rendimiento detalladas ¿Por qué? Sistema de acceso biométrico Falso negativo: Molesto, inconveniente Falso positivo: Posiblemente catastrófico
  • 12. Medidas de rendimiento detalladas ¿Por qué? Sistema de acceso biométrico Aplicamos algún algoritmo A de ML y obtenemos una hipótesis h1 Figure 3: Hipótesis 1
  • 13. Medidas de rendimiento detalladas ¿Por qué? Sistema de acceso biométrico Aplicamos algún algoritmo A de ML y obtenemos una hipótesis h2 Figure 4: Hipótesis 2
  • 14. Medidas de rendimiento detalladas Verdaderos positivos (TPR) Verdaderos negativos (TNR) Falsos positivos (FPR) Falsos negativos (FNR) Característica operativa total (TOC) Característica operativa del receptor (ROC) ROC bajo la curva (AUC)
  • 15. Métodos de evaluación Holdout N-fold cross validation . . .
  • 17. Métodos de evaluación N-fold cross validation
  • 18. Medidas de rendimiento detalladas Razón de verdaderos positivos (TPR) - Sensibilidad Cuantos datos positivos fueron correctamente identificados TP = Número de verdaderos positivos N = Número de datos de prueba totales TPR = TP N “Número de huellas que son validas y que son clasificadas como validas”
  • 19. Medidas de rendimiento detalladas Razón de verdaderos negativos (TNR) - Especificidad Cuantos datos negativos fueron correctamente identificados TN = Número de verdaderos negativos N = Número de datos de prueba totales TPR = TN N “Número de huellas que NO son validas y que son clasifi- cadas como invalidas”
  • 20. Medidas de rendimiento detalladas Razón de falsos positivos (FPR) Cuantos datos positivos fueron incorrectamente identificados FP = Número de falsos positivos N = Número de datos de prueba totales FPR = FP N = 1 − TN N “Número de huellas que NO son validas y que son clasifi- cadas como validas”
  • 21. Medidas de rendimiento detalladas Razón de falsos negativos (FNR) Cuantos datos negativos fueron incorrectamente identificados FN = Número de falsos negativos N = Número de datos de prueba totales FPR = FN N “Número de huellas que son validas y que son clasificadas como invalidas”
  • 22. Medidas de rendimiento detalladas Error y Precisión Error = FP + FN FP + FN + TP + TN Precisión = 1 − Error Exactitud = TP TP + FP
  • 23. Medidas de rendimiento detalladas Métricas para clasificación multi-clase Generalizando estas métricas a clasificaciones de múltiples clases: Precisión(micro) = TP1 + ... + TPn TP1 + ... + TPn + FP1 + ... + FPn Precisión(macro) = Precision1 + ... + Precisionn n
  • 24. Medidas de rendimiento detalladas Matriz de confusión Comparación matricial entre clases esperadas y obtenidas. Permite una fácil evaluación visual.
  • 25. Medidas de rendimiento detalladas Matriz de confusión Condiciones negativas y positivas
  • 26. Medidas de rendimiento detalladas Característica operativa del receptor (ROC) El ROC es una gráfica de verdaderos positivos vs falsos positivos que muestra la habilidad de diagnostico de un clasificador.
  • 27. Característica operativa del receptor (ROC) Diagonal de conjetura aleatoria.
  • 28. Característica operativa del receptor (ROC) Diagonal de conjetura aleatoria.
  • 29. Característica operativa del receptor (ROC) Datos de prueba = N = 200 100 Negativos y 100 Positivos Hipótesis h1, h2, h3 Figure 12: Huella dactilar
  • 30. Característica operativa del receptor (ROC) Condiciones para h1 TP TN FP FN 63 72 28 37
  • 31. Característica operativa del receptor (ROC) Condiciones para h2 TP TN FP FN 77 23 77 23
  • 32. Característica operativa del receptor (ROC) Condiciones para h3 TP TN FP FN 24 12 88 76
  • 33. Característica operativa del receptor (ROC) Matrices de confusión para h1, h2 y h3 Figure 13: Matrices de confusión
  • 34. Característica operativa del receptor (ROC) ROC para h1, h2 y h3
  • 35. Característica operativa del receptor (ROC) Invertimos la hipótesis h3 para obtener h3’
  • 36. Característica operativa del receptor - Área bajo la curva (ROC AUC) El Área bajo la curva de la ROC permite conocer la probabilidad de que se favorezcan instancias positivas sobre instancias negativas. A = −∞ ∞ TPR(T). − FPR(T)dT
  • 37. Característica operativa del receptor - Área bajo la curva (ROC AUC) Recientemente questionado en el ambito de machine learning por ser una medida ruidosa
  • 38. Referencias Jason Brownlee. 2013. “How to evaluate machine learning algorithms” Mahesh Kumar, Nitin R. Patel, James B. Orlin. 2002. “Clustering Data with Measurement Errors” Abu Mostafa et al. 2012. “Learning from data” Sebastian Rashka. 2015. “Python Machine Learning” David Page et al. “Evaluating Machine Learning Methods” Hanczar, Blaise et al. 2010. “Small-sample precision of ROC-related estimates, Bioinformatics”