SlideShare una empresa de Scribd logo
1 de 30
Descargar para leer sin conexión
BOOSTING
John J. Sprockel D.
MISyC
Departamento de Ingeniería de Sistemas
Facultad de Ingeniería
Pontificia Universidad Javeriana
AGENDA
1.  Aspectos históricos
2.  Definición de Boosting
a.  Proceso del Boosting
b.  Esquema del algoritmo
c.  Descripción del algoritmo AdaBoost
3.  Minimización exponencial del error
4.  Caso de multiples clases
5.  Presentación de un artículo
6.  Bibliografía
ASPECTOS HISTÓRICOS
1984 Valiant
L - Modelo
de
aprendizaje
"PAC"
1988 Kearns M,
Valiant L - si
aprendices
débiles juntos
mejoran su
rendimiento
1989 Schapire -
Primer algoritmo
de boosting de
tiempo polinomial
1990 Freund
desarrolla un
algoritmo más
eficiente que
nunca tuvo una
aplicación
practica
1995 Freund y
Schapire
introducen
AdaBoost
DEFINICIÓN DE BOOSTING
Combina múltiples clasificadores
Produce una forma de comité
Con mejor desempeño que el de cada
uno por separado
Es una técnica poderosa
Aprendices débiles (weak learners)
DEFINICIÓN DE BOOSTING
Diferencia con bagging (comité):
-Entrenamiento de clasificadores en
secuencia .
-Se usa para entrenamiento una forma
ponderada del conjunto de datos en el
cual el coeficiente de pesos asociado
con cada punto de datos depende del
desempeño del clasificador anterior.
PROCESO DE BOOSTING
Clasificación con dos casos:
los datos de entrada: x1, …,xN
variables objetivo binarias t1, …, tN
donde tn ∈ {-1, 1}. (original y)
Cada punto de datos tiene un parámetro
p o n d e ra d o a s o c i a d o wn ( Dt ( i ) ) ,
inicialmente se fija para todos en 1/N
PROCESO DE BOOSTING
Clasificación con dos casos:
Debemos suponer que tenemos un
procedimiento disponible para entrenar
un clasificador de base usando los datos
ponderados para dar una función
y(x)∈ {-1, 1}.(Original ht(xi))
PROCESO DE BOOSTING
Los coeficientes ponderados (wn) son
ajustados de acuerdo con el desempeño
del clasificador entrenado previamente
a fin de dar mayor peso a los puntos de
datos mal clasificados.
PROCESO DE BOOSTING
Cuando se han entrenado el número
deseado de clasificadores base, se
combinan para formar un comité
mediante coeficientes que dan un peso
diferente a diferentes clasificadores
base.
ESQUEMA DEL ALGORITMO DE
BOOSTING
Bishop CM. Pattern Recognition and Machine Learning. 2006
ALGORITMO AdaBoost
Bishop CM. Pattern Recognition and Machine Learning. 2006
Medición ponderada del error
ALGORITMO AdaBoost
Bishop CM. Pattern Recognition and Machine Learning. 2006
Corrección de los
coeficientes ponderados
MINIMIZACIÓN EXPONENCIAL DEL
ERROR
Se busca minimizar E, producto de:
Donde fm(xn) es un clasificador definido
en términos de una combinación lineal
de clasificadores de base yl(x) de la
forma:
MINIMIZACIÓN EXPONENCIAL DEL
ERROR
En vez de una minimización global, se
supone que los clasificadores de base y
sus coeficientes (α) son fijos. Así:
MINIMIZACIÓN EXPONENCIAL DEL
ERROR
Si denotamos con los puntos
correctamente clasificados y a los
errados, se obtiene:
MINIMIZACIÓN EXPONENCIAL DEL
ERROR
Después de haber obtenido αm y ym(x),
se actualizan los pesos según:
Dado qué
Derivándose de ahí la ecuación 14.19
MINIMIZACIÓN EXPONENCIAL DEL
ERROR
Existe una posibilidad escasa de sobre-
entrenamiento (overfitting).
Relaciones posibles del Boosting:
-  S V M ( m á r g e n e s d e l c o n j u n t o d e
entrenamiento)
-  Teoría de juegos.
-  Programación lineal
-  Aprendizaje en línea
MINIMIZACIÓN EXPONENCIAL DEL
ERROR
Relación con SVM:
Consideración de ambos de maximizar el
m a rge n m í n i m o e n e l c o n j u n t o d e
entrenamiento:
El denominador en:
Boosting SVM
MINIMIZACIÓN EXPONENCIAL DEL
ERROR
La forma más directa es el AdaBoost.M1, es
adecuada cuando el clasificador débil es
suficientemente robusto para dar una buena
precisión.
Si esta es menor del 50% se requieren
métodos más sofisticados como AdaBoost.MH
que funciona creando un conjunto de
problemas binarios. Otras formas son el
LogitBoost y MultiBoost.
CASO DE MÚLTIPLES CLASES
1.  Rapidez
2.  Simple
3.  Fácil de programar
4.  No tiene parámetros para afinar (tune, T)
5.  No requiere un conocimiento previo del
clasificador débil
6.  Viene con ciertas garantías teóricas
VENTAJAS
1.  El desempeño en un problema particular
depende de los datos y del clasificador
débil.
a.  Es sensible a datos incompletos
b.  Falla con hipótesis débiles complejas o cuando
son muy débiles.
2.  Es particularmente susceptible al ruido.
DESVENTAJAS
BIBLIOGRAFIA
1.  Bishop CM. Chapter 14. Combining Models. In Bishop CM.
Pattern Recognition and Machine Learning. Singapur, Springer
2006. pp 653- 676.
2.  Freund Y, Schapire R. A Short Introduction to Boosting.
Journal of Japanese Society for Artificial Intelligence, 14(5):
771-780, September, 1999.
3.  Meir R, Ratch G. An Introduction to Boosting and Leveraging.
In S. Mendelson, A.J. Smola (Eds.): Advanced Lectures on
Machine Learning, LNAI 2600, pp. 118–183, 2003.
4.  J. Friedman, T. Hastie, and R. Tibshirani. Additive logistic
regression: a statistical view of boosting. The Annals of
Statistics, 28(2):337-407, 2000.
5.  Mandal I, Sairam N. Accurate Prediction of Coronary Artery
Disease Using Reliable Diagnosis System. Journal of Medical
Systems. 2012;36(5):3353–73.

Más contenido relacionado

La actualidad más candente

Integer Representation
Integer RepresentationInteger Representation
Integer Representation
gavhays
 
Machine Learning: Applications, Process and Techniques
Machine Learning: Applications, Process and TechniquesMachine Learning: Applications, Process and Techniques
Machine Learning: Applications, Process and Techniques
Rui Pedro Paiva
 

La actualidad más candente (20)

Red Deer Algorithm (RDA)
Red Deer Algorithm (RDA) Red Deer Algorithm (RDA)
Red Deer Algorithm (RDA)
 
Ensemble learning
Ensemble learningEnsemble learning
Ensemble learning
 
Racing for unbalanced methods selection
Racing for unbalanced methods selectionRacing for unbalanced methods selection
Racing for unbalanced methods selection
 
Bayesian Model-Agnostic Meta-Learning
Bayesian Model-Agnostic Meta-LearningBayesian Model-Agnostic Meta-Learning
Bayesian Model-Agnostic Meta-Learning
 
Machine Learning - Dataset Preparation
Machine Learning - Dataset PreparationMachine Learning - Dataset Preparation
Machine Learning - Dataset Preparation
 
Generative Adversarial Networks (GAN)
Generative Adversarial Networks (GAN)Generative Adversarial Networks (GAN)
Generative Adversarial Networks (GAN)
 
Genetic Algorithm
Genetic AlgorithmGenetic Algorithm
Genetic Algorithm
 
Recommending What Video to Watch Next: A Multitask Ranking System
Recommending What Video to Watch Next: A Multitask Ranking SystemRecommending What Video to Watch Next: A Multitask Ranking System
Recommending What Video to Watch Next: A Multitask Ranking System
 
Object Detection with Transformers
Object Detection with TransformersObject Detection with Transformers
Object Detection with Transformers
 
L14. Anomaly Detection
L14. Anomaly DetectionL14. Anomaly Detection
L14. Anomaly Detection
 
"An Introduction to Machine Learning and How to Teach Machines to See," a Pre...
"An Introduction to Machine Learning and How to Teach Machines to See," a Pre..."An Introduction to Machine Learning and How to Teach Machines to See," a Pre...
"An Introduction to Machine Learning and How to Teach Machines to See," a Pre...
 
Integer Representation
Integer RepresentationInteger Representation
Integer Representation
 
Deep Contexualized Representation
Deep Contexualized RepresentationDeep Contexualized Representation
Deep Contexualized Representation
 
Autoencoders
AutoencodersAutoencoders
Autoencoders
 
08 clustering
08 clustering08 clustering
08 clustering
 
Anomaly Detection using Deep Auto-Encoders
Anomaly Detection using Deep Auto-EncodersAnomaly Detection using Deep Auto-Encoders
Anomaly Detection using Deep Auto-Encoders
 
Design & Analysis of Algorithms Lecture Notes
Design & Analysis of Algorithms Lecture NotesDesign & Analysis of Algorithms Lecture Notes
Design & Analysis of Algorithms Lecture Notes
 
Machine Learning: Applications, Process and Techniques
Machine Learning: Applications, Process and TechniquesMachine Learning: Applications, Process and Techniques
Machine Learning: Applications, Process and Techniques
 
Gradient Boosted Regression Trees in scikit-learn
Gradient Boosted Regression Trees in scikit-learnGradient Boosted Regression Trees in scikit-learn
Gradient Boosted Regression Trees in scikit-learn
 
[Paper] Multiscale Vision Transformers(MVit)
[Paper] Multiscale Vision Transformers(MVit)[Paper] Multiscale Vision Transformers(MVit)
[Paper] Multiscale Vision Transformers(MVit)
 

Similar a Boosting presentación 19 05 14 (9)

Instrumentación electrónica virtual - BOOLE
Instrumentación electrónica virtual - BOOLEInstrumentación electrónica virtual - BOOLE
Instrumentación electrónica virtual - BOOLE
 
Poggi analytics - ensamble - 1b
Poggi   analytics - ensamble - 1bPoggi   analytics - ensamble - 1b
Poggi analytics - ensamble - 1b
 
Computación 2 java
Computación 2 javaComputación 2 java
Computación 2 java
 
Utp i_ay_se_sistemas difusos i 2013-3
 Utp i_ay_se_sistemas difusos i 2013-3 Utp i_ay_se_sistemas difusos i 2013-3
Utp i_ay_se_sistemas difusos i 2013-3
 
Parameter Tuning
Parameter TuningParameter Tuning
Parameter Tuning
 
Computación 2 java
Computación 2 javaComputación 2 java
Computación 2 java
 
Metodos numericos 2013 ma9301
Metodos numericos 2013 ma9301Metodos numericos 2013 ma9301
Metodos numericos 2013 ma9301
 
Metodos numericos sept2012 ma9301
Metodos numericos sept2012 ma9301Metodos numericos sept2012 ma9301
Metodos numericos sept2012 ma9301
 
Metodos numericos 2013 ma9301
Metodos numericos 2013 ma9301Metodos numericos 2013 ma9301
Metodos numericos 2013 ma9301
 

Más de John Diaz

USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL EN EL CUIDADO DE LA SALUD
USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL  EN EL CUIDADO DE LA SALUD USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL  EN EL CUIDADO DE LA SALUD
USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL EN EL CUIDADO DE LA SALUD
John Diaz
 

Más de John Diaz (10)

Modelos Ocultos de Márkov presentación
Modelos Ocultos de Márkov presentaciónModelos Ocultos de Márkov presentación
Modelos Ocultos de Márkov presentación
 
USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL EN EL CUIDADO DE LA SALUD
USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL  EN EL CUIDADO DE LA SALUD USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL  EN EL CUIDADO DE LA SALUD
USO DE LA COMPUTACIÓN PERMISIVA, UBICUA Y MÓVIL EN EL CUIDADO DE LA SALUD
 
Sistemas de Soporte a las Decisiones Clínicas basado en Inteligencia Artifici...
Sistemas de Soporte a las Decisiones Clínicas basado en Inteligencia Artifici...Sistemas de Soporte a las Decisiones Clínicas basado en Inteligencia Artifici...
Sistemas de Soporte a las Decisiones Clínicas basado en Inteligencia Artifici...
 
Sistemas Híbridos centrados en la Lógica Difusa para el Diagnóstico de la enf...
Sistemas Híbridos centrados en la Lógica Difusa para el Diagnóstico de la enf...Sistemas Híbridos centrados en la Lógica Difusa para el Diagnóstico de la enf...
Sistemas Híbridos centrados en la Lógica Difusa para el Diagnóstico de la enf...
 
Programación Genética: Introducción y Aspectos Generales
Programación Genética: Introducción y Aspectos GeneralesProgramación Genética: Introducción y Aspectos Generales
Programación Genética: Introducción y Aspectos Generales
 
Programación Genética: Introducción y Aspectos Generales
Programación Genética: Introducción y Aspectos GeneralesProgramación Genética: Introducción y Aspectos Generales
Programación Genética: Introducción y Aspectos Generales
 
Aproximación Organizacional para Programación Orientada a Agentes: Introducci...
Aproximación Organizacional para Programación Orientada a Agentes: Introducci...Aproximación Organizacional para Programación Orientada a Agentes: Introducci...
Aproximación Organizacional para Programación Orientada a Agentes: Introducci...
 
Aproximación Organizacional para Programación Orientada a Agentes: Introducci...
Aproximación Organizacional para Programación Orientada a Agentes: Introducci...Aproximación Organizacional para Programación Orientada a Agentes: Introducci...
Aproximación Organizacional para Programación Orientada a Agentes: Introducci...
 
Conflictos argumentación resumen john sprockel
Conflictos argumentación resumen   john sprockelConflictos argumentación resumen   john sprockel
Conflictos argumentación resumen john sprockel
 
negociación basada en la argumentación en sistemas multiagentes
negociación basada en la argumentación en sistemas multiagentesnegociación basada en la argumentación en sistemas multiagentes
negociación basada en la argumentación en sistemas multiagentes
 

Último

TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
FRANCISCOJUSTOSIERRA
 
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
ErnestoCano12
 

Último (20)

DIFERENCIA DE COMPRESION Y TENSION EN UN CUERPO
DIFERENCIA DE COMPRESION Y TENSION EN UN CUERPODIFERENCIA DE COMPRESION Y TENSION EN UN CUERPO
DIFERENCIA DE COMPRESION Y TENSION EN UN CUERPO
 
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptxMETRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
 
Cuestionario 20222222222222222222222224.pdf
Cuestionario 20222222222222222222222224.pdfCuestionario 20222222222222222222222224.pdf
Cuestionario 20222222222222222222222224.pdf
 
DIAGRAMAS PID automatizacion y control.ppt
DIAGRAMAS PID automatizacion y control.pptDIAGRAMAS PID automatizacion y control.ppt
DIAGRAMAS PID automatizacion y control.ppt
 
subestaciones electricas, distribucion de energia
subestaciones electricas, distribucion de energiasubestaciones electricas, distribucion de energia
subestaciones electricas, distribucion de energia
 
herrramientas de resistividad para registro de pozos.pptx
herrramientas de resistividad para registro de pozos.pptxherrramientas de resistividad para registro de pozos.pptx
herrramientas de resistividad para registro de pozos.pptx
 
Responsabilidad de padres con sus hijos (1).pptx
Responsabilidad de padres con sus hijos (1).pptxResponsabilidad de padres con sus hijos (1).pptx
Responsabilidad de padres con sus hijos (1).pptx
 
Convocatoria de Becas Caja de Ingenieros_UOC 2024-25
Convocatoria de Becas Caja de Ingenieros_UOC 2024-25Convocatoria de Becas Caja de Ingenieros_UOC 2024-25
Convocatoria de Becas Caja de Ingenieros_UOC 2024-25
 
Sesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obrasSesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obras
 
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
 
50870516-hidroponia. descargado en novppt
50870516-hidroponia. descargado en novppt50870516-hidroponia. descargado en novppt
50870516-hidroponia. descargado en novppt
 
REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptxREGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptx
 
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdfDiseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
 
subestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicassubestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicas
 
1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdf1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdf
 
expo unidad5 metodologia de los sistemas blandos .pptx
expo unidad5 metodologia de los sistemas blandos .pptxexpo unidad5 metodologia de los sistemas blandos .pptx
expo unidad5 metodologia de los sistemas blandos .pptx
 
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOSTEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
 
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdfPRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
 
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
 
REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...
REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...
REAJUSTE DE PRECIOS EN LOS CONTRATOS ADMINISTRATIVOS DE OBRA PUBLICA PACTADOS...
 

Boosting presentación 19 05 14

  • 1. BOOSTING John J. Sprockel D. MISyC Departamento de Ingeniería de Sistemas Facultad de Ingeniería Pontificia Universidad Javeriana
  • 2. AGENDA 1.  Aspectos históricos 2.  Definición de Boosting a.  Proceso del Boosting b.  Esquema del algoritmo c.  Descripción del algoritmo AdaBoost 3.  Minimización exponencial del error 4.  Caso de multiples clases 5.  Presentación de un artículo 6.  Bibliografía
  • 3. ASPECTOS HISTÓRICOS 1984 Valiant L - Modelo de aprendizaje "PAC" 1988 Kearns M, Valiant L - si aprendices débiles juntos mejoran su rendimiento 1989 Schapire - Primer algoritmo de boosting de tiempo polinomial 1990 Freund desarrolla un algoritmo más eficiente que nunca tuvo una aplicación practica 1995 Freund y Schapire introducen AdaBoost
  • 4. DEFINICIÓN DE BOOSTING Combina múltiples clasificadores Produce una forma de comité Con mejor desempeño que el de cada uno por separado Es una técnica poderosa Aprendices débiles (weak learners)
  • 5.
  • 6. DEFINICIÓN DE BOOSTING Diferencia con bagging (comité): -Entrenamiento de clasificadores en secuencia . -Se usa para entrenamiento una forma ponderada del conjunto de datos en el cual el coeficiente de pesos asociado con cada punto de datos depende del desempeño del clasificador anterior.
  • 7. PROCESO DE BOOSTING Clasificación con dos casos: los datos de entrada: x1, …,xN variables objetivo binarias t1, …, tN donde tn ∈ {-1, 1}. (original y) Cada punto de datos tiene un parámetro p o n d e ra d o a s o c i a d o wn ( Dt ( i ) ) , inicialmente se fija para todos en 1/N
  • 8. PROCESO DE BOOSTING Clasificación con dos casos: Debemos suponer que tenemos un procedimiento disponible para entrenar un clasificador de base usando los datos ponderados para dar una función y(x)∈ {-1, 1}.(Original ht(xi))
  • 9. PROCESO DE BOOSTING Los coeficientes ponderados (wn) son ajustados de acuerdo con el desempeño del clasificador entrenado previamente a fin de dar mayor peso a los puntos de datos mal clasificados.
  • 10. PROCESO DE BOOSTING Cuando se han entrenado el número deseado de clasificadores base, se combinan para formar un comité mediante coeficientes que dan un peso diferente a diferentes clasificadores base.
  • 11. ESQUEMA DEL ALGORITMO DE BOOSTING Bishop CM. Pattern Recognition and Machine Learning. 2006
  • 12. ALGORITMO AdaBoost Bishop CM. Pattern Recognition and Machine Learning. 2006 Medición ponderada del error
  • 13. ALGORITMO AdaBoost Bishop CM. Pattern Recognition and Machine Learning. 2006 Corrección de los coeficientes ponderados
  • 14. MINIMIZACIÓN EXPONENCIAL DEL ERROR Se busca minimizar E, producto de: Donde fm(xn) es un clasificador definido en términos de una combinación lineal de clasificadores de base yl(x) de la forma:
  • 15. MINIMIZACIÓN EXPONENCIAL DEL ERROR En vez de una minimización global, se supone que los clasificadores de base y sus coeficientes (α) son fijos. Así:
  • 16. MINIMIZACIÓN EXPONENCIAL DEL ERROR Si denotamos con los puntos correctamente clasificados y a los errados, se obtiene:
  • 17. MINIMIZACIÓN EXPONENCIAL DEL ERROR Después de haber obtenido αm y ym(x), se actualizan los pesos según: Dado qué
  • 18. Derivándose de ahí la ecuación 14.19 MINIMIZACIÓN EXPONENCIAL DEL ERROR
  • 19. Existe una posibilidad escasa de sobre- entrenamiento (overfitting). Relaciones posibles del Boosting: -  S V M ( m á r g e n e s d e l c o n j u n t o d e entrenamiento) -  Teoría de juegos. -  Programación lineal -  Aprendizaje en línea MINIMIZACIÓN EXPONENCIAL DEL ERROR
  • 20. Relación con SVM: Consideración de ambos de maximizar el m a rge n m í n i m o e n e l c o n j u n t o d e entrenamiento: El denominador en: Boosting SVM MINIMIZACIÓN EXPONENCIAL DEL ERROR
  • 21. La forma más directa es el AdaBoost.M1, es adecuada cuando el clasificador débil es suficientemente robusto para dar una buena precisión. Si esta es menor del 50% se requieren métodos más sofisticados como AdaBoost.MH que funciona creando un conjunto de problemas binarios. Otras formas son el LogitBoost y MultiBoost. CASO DE MÚLTIPLES CLASES
  • 22. 1.  Rapidez 2.  Simple 3.  Fácil de programar 4.  No tiene parámetros para afinar (tune, T) 5.  No requiere un conocimiento previo del clasificador débil 6.  Viene con ciertas garantías teóricas VENTAJAS
  • 23. 1.  El desempeño en un problema particular depende de los datos y del clasificador débil. a.  Es sensible a datos incompletos b.  Falla con hipótesis débiles complejas o cuando son muy débiles. 2.  Es particularmente susceptible al ruido. DESVENTAJAS
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30. BIBLIOGRAFIA 1.  Bishop CM. Chapter 14. Combining Models. In Bishop CM. Pattern Recognition and Machine Learning. Singapur, Springer 2006. pp 653- 676. 2.  Freund Y, Schapire R. A Short Introduction to Boosting. Journal of Japanese Society for Artificial Intelligence, 14(5): 771-780, September, 1999. 3.  Meir R, Ratch G. An Introduction to Boosting and Leveraging. In S. Mendelson, A.J. Smola (Eds.): Advanced Lectures on Machine Learning, LNAI 2600, pp. 118–183, 2003. 4.  J. Friedman, T. Hastie, and R. Tibshirani. Additive logistic regression: a statistical view of boosting. The Annals of Statistics, 28(2):337-407, 2000. 5.  Mandal I, Sairam N. Accurate Prediction of Coronary Artery Disease Using Reliable Diagnosis System. Journal of Medical Systems. 2012;36(5):3353–73.