SlideShare una empresa de Scribd logo
1 de 23
Descargar para leer sin conexión
Arbres de
décision
Motivation
Pour certains domaines d’application, il est essentiel de produire des
classifications compréhensibles pour l’utilisateur
Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron
multi-couches), l’information est perdue dans les classes
Arbres de décision
Arbres de
décision
Exemple
Décider si un patient est malade ou bien portant selon sa température et s’il a la
gorge irritée
Arbre de décision
2 classes (malade, bien portant)
2 variables (température, gorge irritée)
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Arbres de
décision
Généralités
Arbre de décision :
Algorithme de classification supervisée
Méthode statistique non-paramétrique
Permet de classer un ensemble d’individus décrits par des variables qualitatives
et quantitatives
Produit des classes les plus homogènes possibles
Arbres de
décision
Un peu de vocabulaire
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Noeud terminal ou feuille
Noeud intermediaire ou test
(chaque noeud intermediaire
est defini par un test construit
a partir d’une variable)
Arbres de
décision
Données et notations
Algorithme CART ←→ Algorithme d’apprentissage
Entrées :
n individus
p variables continues ou discrètes
une variable supplémentaire contenant la classe de chaque individu (c classes)
Sortie :
l’arbre de décision T
Arbres de
décision
Données et notations
N (p) = nombre d’individus associés à la position (noeud) p
N (k|p) = nombre d’individus appartenant à la classe k en sachant
qu’ils sont associés à la position p
P (k|p) =
N(k|p)
N(p)
= proportion des individus appartenant à la classe k
parmi ceux de la position p
Remarque :
Un noeud est pur si tous les individus associés appartiennent à la même classe !
Arbres de
décision
Construction de l’algorithme - exemple
But → construire un arbre de décision qui classe et détermine les caractéristiques des
clients qui consultent leurs comptes sur internet
Variables
M : moyenne des montants sur le compte
A : âge du client
R : lieu de résidence du client
E : le client à des études supérieures ?
I : le client consulte ses comptes sur internet ?
Arbres de
décision
Construction de l’algorithme - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
Arbres de
décision
Construction de l’algorithme - exemple
La construction est descendante
Au début tous les individus sont regroupés
Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut
construire un test sur une variable qui permettra de mieux discriminer les
individus ?
Quatre constructions possibles, suivant les variables Montant (M), Age (A),
Résidence (R) et Etudes (E)
Arbres de
décision
Construction de l’algorithme - exemple
1. Construction selon la variable Montant (M)
Client M I
1 moyen oui
2 élevé non
3 faible non
4 faible oui
5 moyen oui
6 élevé non
7 moyen non
8 faible non
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Arbres de
décision
Construction de l’algorithme - exemple
2. Construction selon la variable Age (A)
Client A I
1 moyen oui
2 moyen non
3 âgé non
4 moyen oui
5 jeune oui
6 âgé non
7 âgé non
8 moyen non
(3,5)
Moyen
Age
Jeune Age
(1,0) (2,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
3. Construction selon la variable Résidence (R)
Client R I
1 village oui
2 bourg non
3 bourg non
4 bourg oui
5 ville oui
6 ville non
7 ville non
8 village non
(3,5)
Residence
Ville Bourg Village
(1,2) (1,2) (1,1)
Arbres de
décision
Construction de l’algorithme - exemple
4. Construction selon la variable Etudes (E)
Client E I
1 oui oui
2 non non
3 non non
4 oui oui
5 oui oui
6 oui non
7 oui non
8 non non
(3,5)
Oui Non
Etudes
(3,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,2),(2,1),(0,2)
Age (A) (1,0),(2,2),(0,3)
Résidence (R) (1,2),(1,2),(1,1)
Etudes (E) (3,2),(0,3)
Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce
test !
Sur A, deux noeuds sur trois sont “purs” !
Comment tout écrire mathématiquement ?
Arbres de
décision
Degré de mélangeance
On a besoin de comparer les différents choix possibles
On introduit des fonctions qui permettent de mesurer le degré de mélangeance
dans les différentes classes
Propriétés des fonctions :
Le minimum est atteint lorsque tous les noeuds sont “purs”
Le maximum est atteint lorsque les individus sont équirepartis entre les classes
Arbres de
décision
Degré de mélangeance
Exemples de fonctions
Fonction d’entropie :
Entropie (p) = −
C
k=1
P (k|p) ln P (k|p)
Fonction de Gini :
Gini (p) = 1 −
C
k=1
P2
(k|p) = 2
k<k′
P (k|p) P k′
|p
Arbres de
décision
Degré de mélangeance
p p. . .
p
p
1 2 n
Test t a n modalites
t = le test (la variable)
n = le nombre de modalités
de t
i = la fonction pour mesurer
le degré de mélangeance
On introduit la fonction de gain :
Gain (p, t) = i (p) −
n
j=1
Pj i pj
Pj = la proportion des individus de la position p qui vont en position pj
La position p est fixée !
On cherche le test qui maximise le gain !
Arbres de
décision
Calcul du degré de mélangeance - exemple
Tester sur la variable Montant (M)
On considère le noeud 0 : (3,5)
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Gain (0, M) = i (0) − 3
8
i (1) + 3
8
i (2) + 2
8
i (3)
On choisit i = l’entropie !
Entropie (1) = −
1
3
ln
1
3
−
2
3
ln
2
3
= 0.64
Entropie (2) = −
2
3
ln
2
3
−
1
3
ln
1
3
= 0.64
Entropie (3) = −
2
2
ln
2
2
= 0
Arbres de
décision
Calcul du degré de mélangeance - exemple
On considère le noeud 0 : (3,5)
Variable test Gain
Montant (M) Gain (0, M) = Entropie (0) − 0.48
Age (A) Gain (0, A) = Entropie (0) − 0.35
Résidence (R) Gain (0, R) = Entropie (0) − 0.65
Etudes (E) Gain (0, R) = Entropie (0) − 0.42
Arbres de
décision
Calcul du degré de mélangeance - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
On continue!
(2,2)
(3,5)
Arbres de
décision
Suite de la construction - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
⇓
Client M R E I
1 moyen village oui oui
2 élevé bourg non non
4 faible bourg oui oui
8 faible village non non
Arbres de
décision
Suite de la construction - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,1),(1,0),(0,1)
Résidence (R) (1,1),(1,1)
Etudes (E) (2,0),(0,2)
Calculer le gain pour chaque test ?
Arbres de
décision
Suite de la construction - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
(2,2)
(3,5)
(2,0) (0,2)
Etudes
oui non
OUI NON

Más contenido relacionado

La actualidad más candente

Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
hanamettali
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
imane26
 
Analyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afcAnalyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afc
Rémi Bachelet
 

La actualidad más candente (20)

Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
Présentation projet de fin d'étude
Présentation projet de fin d'étudePrésentation projet de fin d'étude
Présentation projet de fin d'étude
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
theories des jeux.pptx
theories des jeux.pptxtheories des jeux.pptx
theories des jeux.pptx
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Présentation de mon PFE
Présentation de mon PFEPrésentation de mon PFE
Présentation de mon PFE
 
Rapport de stage PFE - Mémoire master: Développement d'une application Android
Rapport de stage PFE - Mémoire master: Développement d'une application AndroidRapport de stage PFE - Mémoire master: Développement d'une application Android
Rapport de stage PFE - Mémoire master: Développement d'une application Android
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des Correspondances
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
 
Td dw1
Td dw1Td dw1
Td dw1
 
Rapport Projet de Fin d'Etudes
Rapport Projet de Fin d'EtudesRapport Projet de Fin d'Etudes
Rapport Projet de Fin d'Etudes
 
Telecharger Exercices corrigés PL/SQL
Telecharger Exercices corrigés PL/SQLTelecharger Exercices corrigés PL/SQL
Telecharger Exercices corrigés PL/SQL
 
Soutenance projet
Soutenance projetSoutenance projet
Soutenance projet
 
Analyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afcAnalyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afc
 
Présentation PFE
Présentation PFEPrésentation PFE
Présentation PFE
 

Destacado

Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
Chahrawoods Dmz
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
hadhoum
 

Destacado (12)

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)
 
Methodes agile
Methodes agileMethodes agile
Methodes agile
 
Rédiger des User Stories
Rédiger des User StoriesRédiger des User Stories
Rédiger des User Stories
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexité
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshop
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintes
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décision
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercise
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ?
 

Similar a Arbre de décision

Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
OuailChoukhairi
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type Clustering
Franck Dernoncourt
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlib
ebiznext
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
nesrinetaamallah
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et Fiabilite
Rémi Bachelet
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
mohamedchaouche
 

Similar a Arbre de décision (20)

Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 Sigma
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big Data
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type Clustering
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlib
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
 
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptsphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritère
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et Fiabilite
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisions
 

Más de Yassine Badri

Más de Yassine Badri (19)

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de données
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationelles
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du merise
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de données
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentation
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EE
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock
 
cours base de données
cours base de donnéescours base de données
cours base de données
 
Cours php
Cours php Cours php
Cours php
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1
 
Chap 02 poo en java
Chap 02 poo en javaChap 02 poo en java
Chap 02 poo en java
 
Ch 01 poo
Ch 01 pooCh 01 poo
Ch 01 poo
 

Último

L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
Faga1939
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 

Último (13)

Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 

Arbre de décision

  • 1. Arbres de décision Motivation Pour certains domaines d’application, il est essentiel de produire des classifications compréhensibles pour l’utilisateur Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron multi-couches), l’information est perdue dans les classes Arbres de décision
  • 2. Arbres de décision Exemple Décider si un patient est malade ou bien portant selon sa température et s’il a la gorge irritée Arbre de décision 2 classes (malade, bien portant) 2 variables (température, gorge irritée) malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON
  • 3. Arbres de décision Généralités Arbre de décision : Algorithme de classification supervisée Méthode statistique non-paramétrique Permet de classer un ensemble d’individus décrits par des variables qualitatives et quantitatives Produit des classes les plus homogènes possibles
  • 4. Arbres de décision Un peu de vocabulaire malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON Noeud terminal ou feuille Noeud intermediaire ou test (chaque noeud intermediaire est defini par un test construit a partir d’une variable)
  • 5. Arbres de décision Données et notations Algorithme CART ←→ Algorithme d’apprentissage Entrées : n individus p variables continues ou discrètes une variable supplémentaire contenant la classe de chaque individu (c classes) Sortie : l’arbre de décision T
  • 6. Arbres de décision Données et notations N (p) = nombre d’individus associés à la position (noeud) p N (k|p) = nombre d’individus appartenant à la classe k en sachant qu’ils sont associés à la position p P (k|p) = N(k|p) N(p) = proportion des individus appartenant à la classe k parmi ceux de la position p Remarque : Un noeud est pur si tous les individus associés appartiennent à la même classe !
  • 7. Arbres de décision Construction de l’algorithme - exemple But → construire un arbre de décision qui classe et détermine les caractéristiques des clients qui consultent leurs comptes sur internet Variables M : moyenne des montants sur le compte A : âge du client R : lieu de résidence du client E : le client à des études supérieures ? I : le client consulte ses comptes sur internet ?
  • 8. Arbres de décision Construction de l’algorithme - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non
  • 9. Arbres de décision Construction de l’algorithme - exemple La construction est descendante Au début tous les individus sont regroupés Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut construire un test sur une variable qui permettra de mieux discriminer les individus ? Quatre constructions possibles, suivant les variables Montant (M), Age (A), Résidence (R) et Etudes (E)
  • 10. Arbres de décision Construction de l’algorithme - exemple 1. Construction selon la variable Montant (M) Client M I 1 moyen oui 2 élevé non 3 faible non 4 faible oui 5 moyen oui 6 élevé non 7 moyen non 8 faible non Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen
  • 11. Arbres de décision Construction de l’algorithme - exemple 2. Construction selon la variable Age (A) Client A I 1 moyen oui 2 moyen non 3 âgé non 4 moyen oui 5 jeune oui 6 âgé non 7 âgé non 8 moyen non (3,5) Moyen Age Jeune Age (1,0) (2,2) (0,3)
  • 12. Arbres de décision Construction de l’algorithme - exemple 3. Construction selon la variable Résidence (R) Client R I 1 village oui 2 bourg non 3 bourg non 4 bourg oui 5 ville oui 6 ville non 7 ville non 8 village non (3,5) Residence Ville Bourg Village (1,2) (1,2) (1,1)
  • 13. Arbres de décision Construction de l’algorithme - exemple 4. Construction selon la variable Etudes (E) Client E I 1 oui oui 2 non non 3 non non 4 oui oui 5 oui oui 6 oui non 7 oui non 8 non non (3,5) Oui Non Etudes (3,2) (0,3)
  • 14. Arbres de décision Construction de l’algorithme - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,2),(2,1),(0,2) Age (A) (1,0),(2,2),(0,3) Résidence (R) (1,2),(1,2),(1,1) Etudes (E) (3,2),(0,3) Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce test ! Sur A, deux noeuds sur trois sont “purs” ! Comment tout écrire mathématiquement ?
  • 15. Arbres de décision Degré de mélangeance On a besoin de comparer les différents choix possibles On introduit des fonctions qui permettent de mesurer le degré de mélangeance dans les différentes classes Propriétés des fonctions : Le minimum est atteint lorsque tous les noeuds sont “purs” Le maximum est atteint lorsque les individus sont équirepartis entre les classes
  • 16. Arbres de décision Degré de mélangeance Exemples de fonctions Fonction d’entropie : Entropie (p) = − C k=1 P (k|p) ln P (k|p) Fonction de Gini : Gini (p) = 1 − C k=1 P2 (k|p) = 2 k<k′ P (k|p) P k′ |p
  • 17. Arbres de décision Degré de mélangeance p p. . . p p 1 2 n Test t a n modalites t = le test (la variable) n = le nombre de modalités de t i = la fonction pour mesurer le degré de mélangeance On introduit la fonction de gain : Gain (p, t) = i (p) − n j=1 Pj i pj Pj = la proportion des individus de la position p qui vont en position pj La position p est fixée ! On cherche le test qui maximise le gain !
  • 18. Arbres de décision Calcul du degré de mélangeance - exemple Tester sur la variable Montant (M) On considère le noeud 0 : (3,5) Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen Gain (0, M) = i (0) − 3 8 i (1) + 3 8 i (2) + 2 8 i (3) On choisit i = l’entropie ! Entropie (1) = − 1 3 ln 1 3 − 2 3 ln 2 3 = 0.64 Entropie (2) = − 2 3 ln 2 3 − 1 3 ln 1 3 = 0.64 Entropie (3) = − 2 2 ln 2 2 = 0
  • 19. Arbres de décision Calcul du degré de mélangeance - exemple On considère le noeud 0 : (3,5) Variable test Gain Montant (M) Gain (0, M) = Entropie (0) − 0.48 Age (A) Gain (0, A) = Entropie (0) − 0.35 Résidence (R) Gain (0, R) = Entropie (0) − 0.65 Etudes (E) Gain (0, R) = Entropie (0) − 0.42
  • 20. Arbres de décision Calcul du degré de mélangeance - exemple (1,0) Age jeune moyen age (0,3) OUI NON On continue! (2,2) (3,5)
  • 21. Arbres de décision Suite de la construction - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non ⇓ Client M R E I 1 moyen village oui oui 2 élevé bourg non non 4 faible bourg oui oui 8 faible village non non
  • 22. Arbres de décision Suite de la construction - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,1),(1,0),(0,1) Résidence (R) (1,1),(1,1) Etudes (E) (2,0),(0,2) Calculer le gain pour chaque test ?
  • 23. Arbres de décision Suite de la construction - exemple (1,0) Age jeune moyen age (0,3) OUI NON (2,2) (3,5) (2,0) (0,2) Etudes oui non OUI NON