SlideShare una empresa de Scribd logo
1 de 23
Descargar para leer sin conexión
Arbres de
décision
Motivation
Pour certains domaines d’application, il est essentiel de produire des
classifications compréhensibles pour l’utilisateur
Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron
multi-couches), l’information est perdue dans les classes
Arbres de décision
Arbres de
décision
Exemple
Décider si un patient est malade ou bien portant selon sa température et s’il a la
gorge irritée
Arbre de décision
2 classes (malade, bien portant)
2 variables (température, gorge irritée)
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Arbres de
décision
Généralités
Arbre de décision :
Algorithme de classification supervisée
Méthode statistique non-paramétrique
Permet de classer un ensemble d’individus décrits par des variables qualitatives
et quantitatives
Produit des classes les plus homogènes possibles
Arbres de
décision
Un peu de vocabulaire
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Noeud terminal ou feuille
Noeud intermediaire ou test
(chaque noeud intermediaire
est defini par un test construit
a partir d’une variable)
Arbres de
décision
Données et notations
Algorithme CART ←→ Algorithme d’apprentissage
Entrées :
n individus
p variables continues ou discrètes
une variable supplémentaire contenant la classe de chaque individu (c classes)
Sortie :
l’arbre de décision T
Arbres de
décision
Données et notations
N (p) = nombre d’individus associés à la position (noeud) p
N (k|p) = nombre d’individus appartenant à la classe k en sachant
qu’ils sont associés à la position p
P (k|p) =
N(k|p)
N(p)
= proportion des individus appartenant à la classe k
parmi ceux de la position p
Remarque :
Un noeud est pur si tous les individus associés appartiennent à la même classe !
Arbres de
décision
Construction de l’algorithme - exemple
But → construire un arbre de décision qui classe et détermine les caractéristiques des
clients qui consultent leurs comptes sur internet
Variables
M : moyenne des montants sur le compte
A : âge du client
R : lieu de résidence du client
E : le client à des études supérieures ?
I : le client consulte ses comptes sur internet ?
Arbres de
décision
Construction de l’algorithme - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
Arbres de
décision
Construction de l’algorithme - exemple
La construction est descendante
Au début tous les individus sont regroupés
Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut
construire un test sur une variable qui permettra de mieux discriminer les
individus ?
Quatre constructions possibles, suivant les variables Montant (M), Age (A),
Résidence (R) et Etudes (E)
Arbres de
décision
Construction de l’algorithme - exemple
1. Construction selon la variable Montant (M)
Client M I
1 moyen oui
2 élevé non
3 faible non
4 faible oui
5 moyen oui
6 élevé non
7 moyen non
8 faible non
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Arbres de
décision
Construction de l’algorithme - exemple
2. Construction selon la variable Age (A)
Client A I
1 moyen oui
2 moyen non
3 âgé non
4 moyen oui
5 jeune oui
6 âgé non
7 âgé non
8 moyen non
(3,5)
Moyen
Age
Jeune Age
(1,0) (2,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
3. Construction selon la variable Résidence (R)
Client R I
1 village oui
2 bourg non
3 bourg non
4 bourg oui
5 ville oui
6 ville non
7 ville non
8 village non
(3,5)
Residence
Ville Bourg Village
(1,2) (1,2) (1,1)
Arbres de
décision
Construction de l’algorithme - exemple
4. Construction selon la variable Etudes (E)
Client E I
1 oui oui
2 non non
3 non non
4 oui oui
5 oui oui
6 oui non
7 oui non
8 non non
(3,5)
Oui Non
Etudes
(3,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,2),(2,1),(0,2)
Age (A) (1,0),(2,2),(0,3)
Résidence (R) (1,2),(1,2),(1,1)
Etudes (E) (3,2),(0,3)
Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce
test !
Sur A, deux noeuds sur trois sont “purs” !
Comment tout écrire mathématiquement ?
Arbres de
décision
Degré de mélangeance
On a besoin de comparer les différents choix possibles
On introduit des fonctions qui permettent de mesurer le degré de mélangeance
dans les différentes classes
Propriétés des fonctions :
Le minimum est atteint lorsque tous les noeuds sont “purs”
Le maximum est atteint lorsque les individus sont équirepartis entre les classes
Arbres de
décision
Degré de mélangeance
Exemples de fonctions
Fonction d’entropie :
Entropie (p) = −
C
k=1
P (k|p) ln P (k|p)
Fonction de Gini :
Gini (p) = 1 −
C
k=1
P2
(k|p) = 2
k<k′
P (k|p) P k′
|p
Arbres de
décision
Degré de mélangeance
p p. . .
p
p
1 2 n
Test t a n modalites
t = le test (la variable)
n = le nombre de modalités
de t
i = la fonction pour mesurer
le degré de mélangeance
On introduit la fonction de gain :
Gain (p, t) = i (p) −
n
j=1
Pj i pj
Pj = la proportion des individus de la position p qui vont en position pj
La position p est fixée !
On cherche le test qui maximise le gain !
Arbres de
décision
Calcul du degré de mélangeance - exemple
Tester sur la variable Montant (M)
On considère le noeud 0 : (3,5)
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Gain (0, M) = i (0) − 3
8
i (1) + 3
8
i (2) + 2
8
i (3)
On choisit i = l’entropie !
Entropie (1) = −
1
3
ln
1
3
−
2
3
ln
2
3
= 0.64
Entropie (2) = −
2
3
ln
2
3
−
1
3
ln
1
3
= 0.64
Entropie (3) = −
2
2
ln
2
2
= 0
Arbres de
décision
Calcul du degré de mélangeance - exemple
On considère le noeud 0 : (3,5)
Variable test Gain
Montant (M) Gain (0, M) = Entropie (0) − 0.48
Age (A) Gain (0, A) = Entropie (0) − 0.35
Résidence (R) Gain (0, R) = Entropie (0) − 0.65
Etudes (E) Gain (0, R) = Entropie (0) − 0.42
Arbres de
décision
Calcul du degré de mélangeance - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
On continue!
(2,2)
(3,5)
Arbres de
décision
Suite de la construction - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
⇓
Client M R E I
1 moyen village oui oui
2 élevé bourg non non
4 faible bourg oui oui
8 faible village non non
Arbres de
décision
Suite de la construction - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,1),(1,0),(0,1)
Résidence (R) (1,1),(1,1)
Etudes (E) (2,0),(0,2)
Calculer le gain pour chaque test ?
Arbres de
décision
Suite de la construction - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
(2,2)
(3,5)
(2,0) (0,2)
Etudes
oui non
OUI NON

Más contenido relacionado

La actualidad más candente

Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Mohamed Heny SELMI
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data miningDonia Hammami
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdfimane26
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleSoft Computing
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETLLilia Sfaxi
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningHakim Nasaoui
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Examen principal - Fondement Multimedia - correction
Examen principal - Fondement Multimedia - correctionExamen principal - Fondement Multimedia - correction
Examen principal - Fondement Multimedia - correctionInes Ouaz
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesMohamed Heny SELMI
 

La actualidad más candente (20)

arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Data Mining
Data MiningData Mining
Data Mining
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence Artificielle
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learning
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Examen principal - Fondement Multimedia - correction
Examen principal - Fondement Multimedia - correctionExamen principal - Fondement Multimedia - correction
Examen principal - Fondement Multimedia - correction
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 

Destacado

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Pierrick REVOL
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexitéSana Aroussi
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshopaymenli
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintesOrochi Krizalid
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql Yassine Badri
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionARIJ BenHarrath
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite completChahrawoods Dmz
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercisePeter Antman
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigéshadhoum
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Thiga
 

Destacado (12)

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)
 
Methodes agile
Methodes agileMethodes agile
Methodes agile
 
Rédiger des User Stories
Rédiger des User StoriesRédiger des User Stories
Rédiger des User Stories
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexité
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshop
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintes
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décision
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercise
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ?
 

Similar a Arbre de décision

Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdfOuailChoukhairi
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaXL Formation
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression Mariem Chaaben
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Jean-Michel POU
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016ibtissam el hassani
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big DataJeremy Greze
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringFranck Dernoncourt
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlibebiznext
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfnesrinetaamallah
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfFootballLovers9
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreGroupe ARTICQUE
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...Adad Med Chérif
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et FiabiliteRémi Bachelet
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisionsJean-Michel POU
 
Cours statistiques
Cours statistiquesCours statistiques
Cours statistiquesvauzelle
 

Similar a Arbre de décision (20)

Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 Sigma
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
les arbres de décision ou de régression
les arbres de décision ou de régression les arbres de décision ou de régression
les arbres de décision ou de régression
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big Data
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type Clustering
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlib
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritère
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et Fiabilite
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisions
 
Cours statistiques
Cours statistiquesCours statistiques
Cours statistiques
 

Más de Yassine Badri

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de donnéesYassine Badri
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationellesYassine Badri
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du meriseYassine Badri
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesYassine Badri
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours Yassine Badri
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentationYassine Badri
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock Yassine Badri
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php Yassine Badri
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EEYassine Badri
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock Yassine Badri
 
cours base de données
cours base de donnéescours base de données
cours base de donnéesYassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatiqueYassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatiqueYassine Badri
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Yassine Badri
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2Yassine Badri
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1Yassine Badri
 

Más de Yassine Badri (19)

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de données
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationelles
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du merise
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de données
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentation
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EE
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock
 
cours base de données
cours base de donnéescours base de données
cours base de données
 
Cours php
Cours php Cours php
Cours php
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1
 
Chap 02 poo en java
Chap 02 poo en javaChap 02 poo en java
Chap 02 poo en java
 
Ch 01 poo
Ch 01 pooCh 01 poo
Ch 01 poo
 

Último

Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...
Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...
Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...NaimDoumissi
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film françaisTxaruka
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfRiDaHAziz
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film françaisTxaruka
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfbdp12
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
Cours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationCours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationpapediallo3
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxMartin M Flynn
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 37
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfRiDaHAziz
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Gabriel Gay-Para
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursStagiaireLearningmat
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneTxaruka
 
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxJCAC
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 37
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfSylvianeBachy
 

Último (18)

Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...
Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...
Potentiel du Maroc en Produits du Terroir et Stratégie Adoptée pour le dévelo...
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film français
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdf
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film français
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
Cours de Management des Systèmes d'information
Cours de Management des Systèmes d'informationCours de Management des Systèmes d'information
Cours de Management des Systèmes d'information
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdf
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceurs
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienne
 
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
 
Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
 

Arbre de décision

  • 1. Arbres de décision Motivation Pour certains domaines d’application, il est essentiel de produire des classifications compréhensibles pour l’utilisateur Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron multi-couches), l’information est perdue dans les classes Arbres de décision
  • 2. Arbres de décision Exemple Décider si un patient est malade ou bien portant selon sa température et s’il a la gorge irritée Arbre de décision 2 classes (malade, bien portant) 2 variables (température, gorge irritée) malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON
  • 3. Arbres de décision Généralités Arbre de décision : Algorithme de classification supervisée Méthode statistique non-paramétrique Permet de classer un ensemble d’individus décrits par des variables qualitatives et quantitatives Produit des classes les plus homogènes possibles
  • 4. Arbres de décision Un peu de vocabulaire malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON Noeud terminal ou feuille Noeud intermediaire ou test (chaque noeud intermediaire est defini par un test construit a partir d’une variable)
  • 5. Arbres de décision Données et notations Algorithme CART ←→ Algorithme d’apprentissage Entrées : n individus p variables continues ou discrètes une variable supplémentaire contenant la classe de chaque individu (c classes) Sortie : l’arbre de décision T
  • 6. Arbres de décision Données et notations N (p) = nombre d’individus associés à la position (noeud) p N (k|p) = nombre d’individus appartenant à la classe k en sachant qu’ils sont associés à la position p P (k|p) = N(k|p) N(p) = proportion des individus appartenant à la classe k parmi ceux de la position p Remarque : Un noeud est pur si tous les individus associés appartiennent à la même classe !
  • 7. Arbres de décision Construction de l’algorithme - exemple But → construire un arbre de décision qui classe et détermine les caractéristiques des clients qui consultent leurs comptes sur internet Variables M : moyenne des montants sur le compte A : âge du client R : lieu de résidence du client E : le client à des études supérieures ? I : le client consulte ses comptes sur internet ?
  • 8. Arbres de décision Construction de l’algorithme - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non
  • 9. Arbres de décision Construction de l’algorithme - exemple La construction est descendante Au début tous les individus sont regroupés Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut construire un test sur une variable qui permettra de mieux discriminer les individus ? Quatre constructions possibles, suivant les variables Montant (M), Age (A), Résidence (R) et Etudes (E)
  • 10. Arbres de décision Construction de l’algorithme - exemple 1. Construction selon la variable Montant (M) Client M I 1 moyen oui 2 élevé non 3 faible non 4 faible oui 5 moyen oui 6 élevé non 7 moyen non 8 faible non Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen
  • 11. Arbres de décision Construction de l’algorithme - exemple 2. Construction selon la variable Age (A) Client A I 1 moyen oui 2 moyen non 3 âgé non 4 moyen oui 5 jeune oui 6 âgé non 7 âgé non 8 moyen non (3,5) Moyen Age Jeune Age (1,0) (2,2) (0,3)
  • 12. Arbres de décision Construction de l’algorithme - exemple 3. Construction selon la variable Résidence (R) Client R I 1 village oui 2 bourg non 3 bourg non 4 bourg oui 5 ville oui 6 ville non 7 ville non 8 village non (3,5) Residence Ville Bourg Village (1,2) (1,2) (1,1)
  • 13. Arbres de décision Construction de l’algorithme - exemple 4. Construction selon la variable Etudes (E) Client E I 1 oui oui 2 non non 3 non non 4 oui oui 5 oui oui 6 oui non 7 oui non 8 non non (3,5) Oui Non Etudes (3,2) (0,3)
  • 14. Arbres de décision Construction de l’algorithme - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,2),(2,1),(0,2) Age (A) (1,0),(2,2),(0,3) Résidence (R) (1,2),(1,2),(1,1) Etudes (E) (3,2),(0,3) Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce test ! Sur A, deux noeuds sur trois sont “purs” ! Comment tout écrire mathématiquement ?
  • 15. Arbres de décision Degré de mélangeance On a besoin de comparer les différents choix possibles On introduit des fonctions qui permettent de mesurer le degré de mélangeance dans les différentes classes Propriétés des fonctions : Le minimum est atteint lorsque tous les noeuds sont “purs” Le maximum est atteint lorsque les individus sont équirepartis entre les classes
  • 16. Arbres de décision Degré de mélangeance Exemples de fonctions Fonction d’entropie : Entropie (p) = − C k=1 P (k|p) ln P (k|p) Fonction de Gini : Gini (p) = 1 − C k=1 P2 (k|p) = 2 k<k′ P (k|p) P k′ |p
  • 17. Arbres de décision Degré de mélangeance p p. . . p p 1 2 n Test t a n modalites t = le test (la variable) n = le nombre de modalités de t i = la fonction pour mesurer le degré de mélangeance On introduit la fonction de gain : Gain (p, t) = i (p) − n j=1 Pj i pj Pj = la proportion des individus de la position p qui vont en position pj La position p est fixée ! On cherche le test qui maximise le gain !
  • 18. Arbres de décision Calcul du degré de mélangeance - exemple Tester sur la variable Montant (M) On considère le noeud 0 : (3,5) Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen Gain (0, M) = i (0) − 3 8 i (1) + 3 8 i (2) + 2 8 i (3) On choisit i = l’entropie ! Entropie (1) = − 1 3 ln 1 3 − 2 3 ln 2 3 = 0.64 Entropie (2) = − 2 3 ln 2 3 − 1 3 ln 1 3 = 0.64 Entropie (3) = − 2 2 ln 2 2 = 0
  • 19. Arbres de décision Calcul du degré de mélangeance - exemple On considère le noeud 0 : (3,5) Variable test Gain Montant (M) Gain (0, M) = Entropie (0) − 0.48 Age (A) Gain (0, A) = Entropie (0) − 0.35 Résidence (R) Gain (0, R) = Entropie (0) − 0.65 Etudes (E) Gain (0, R) = Entropie (0) − 0.42
  • 20. Arbres de décision Calcul du degré de mélangeance - exemple (1,0) Age jeune moyen age (0,3) OUI NON On continue! (2,2) (3,5)
  • 21. Arbres de décision Suite de la construction - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non ⇓ Client M R E I 1 moyen village oui oui 2 élevé bourg non non 4 faible bourg oui oui 8 faible village non non
  • 22. Arbres de décision Suite de la construction - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,1),(1,0),(0,1) Résidence (R) (1,1),(1,1) Etudes (E) (2,0),(0,2) Calculer le gain pour chaque test ?
  • 23. Arbres de décision Suite de la construction - exemple (1,0) Age jeune moyen age (0,3) OUI NON (2,2) (3,5) (2,0) (0,2) Etudes oui non OUI NON