SlideShare una empresa de Scribd logo
1 de 20
Descargar para leer sin conexión
Les sondages à probabilités inégales
Mahamadou HARO
Ingénieur Statisticien Économiste
Séminaire de sondage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14
Plan de la présentation
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14
Principe
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Formules d’estimation dans le cas avec remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14
Formules d’estimation dans le cas avec remise
Formules d’estimation dans le cas avec remise
Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacun
des tirages et on tire un échantillon de taille n. On a N
α=1 Aα = 1
(donc chaque Aα , est inférieur à 1 et souvent de valeur très faible).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14
Formules d’estimation dans le cas avec remise
Estimation d’un total
L’estimateur du total de la variable Y (sur l’univers) proposé à partir de
l’échantillon tiré est :
ˆT(Y) =
1
n
n
i=1
yi
Ai
(1)
Où yi est la valeur de la variable Y pour l’unité sélectionnée au ième
tirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tient
donc compte des probabilités de tirage différentes pour produire
l’estimation du total. Cet estimateur est sans biais :
E(ˆT(Y)) =
N
α=1
Yα
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14
Formules d’estimation dans le cas avec remise
Estimation d’une moyenne, d’un ratio
Pour estimer la moyenne Y on utilise l’estimateur
ˆT(Y)
N
Sa variance est :
V
ˆT(Y)
N
=
1
N2
V(ˆT(Y))
Un ratio est estimé comme le rapport de l’estimation de deux masses.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14
Méthodes de tirage
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14
Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Aperçu sur le sondage à probabilités inégales sans
remise
Le modèle qui a été appliqué précédemment pour produire un
estimateur est beaucoup plus difficile à utiliser : en effet, les
probabilités de tirage se déforment au fur et à mesure qu’on réalise les
tirages.
Au premier tirage A1
i = Ai ;
Au deuxième tirage A2
j =
A1
j
1−A1
i
sachant que c’est i qui a été tiré au
premier tirage ; etc.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14
Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14

Más contenido relacionado

La actualidad más candente

Ppt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluationPpt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluationUSIGGENEVE
 
Analyse de régression linéaire
Analyse de régression linéaire Analyse de régression linéaire
Analyse de régression linéaire Adad Med Chérif
 
La Regression lineaire
La Regression lineaireLa Regression lineaire
La Regression lineaireFIKRIMAIL
 
[Gestion des risques et conformite] de bale ii à bale iii
[Gestion des risques et conformite] de bale ii à bale iii[Gestion des risques et conformite] de bale ii à bale iii
[Gestion des risques et conformite] de bale ii à bale iiionepoint x weave
 
Etude, dimensionnement, calcul des structures et conception d’une empileuse s...
Etude, dimensionnement, calcul des structures et conception d’une empileuse s...Etude, dimensionnement, calcul des structures et conception d’une empileuse s...
Etude, dimensionnement, calcul des structures et conception d’une empileuse s...Hamza Ibrahmi
 
Chapitre2: Sondage aléatoire simple
Chapitre2: Sondage aléatoire simpleChapitre2: Sondage aléatoire simple
Chapitre2: Sondage aléatoire simpleMahamadou Haro
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Introduction gestion des risques
Introduction gestion des risquesIntroduction gestion des risques
Introduction gestion des risquesJérémy Morvan
 
NOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUE
NOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUENOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUE
NOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUEDavid Yvan Loïc Damoh
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
les processus VAR et SVAR
les processus VAR et SVAR  les processus VAR et SVAR
les processus VAR et SVAR Anissa ATMANI
 
Limites classiques de toutes les fonctions 4
Limites classiques de toutes les fonctions 4Limites classiques de toutes les fonctions 4
Limites classiques de toutes les fonctions 4ulrich loemba
 
Ibm spss decision trees
Ibm spss decision treesIbm spss decision trees
Ibm spss decision treesisamil
 
Introduction a l'actuariat: assurance Non Vie
Introduction a l'actuariat: assurance Non VieIntroduction a l'actuariat: assurance Non Vie
Introduction a l'actuariat: assurance Non VieIbtissam medarhri
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 

La actualidad más candente (20)

Ppt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluationPpt techniques de colectes de donnees en suivi evaluation
Ppt techniques de colectes de donnees en suivi evaluation
 
Analyse de régression linéaire
Analyse de régression linéaire Analyse de régression linéaire
Analyse de régression linéaire
 
La Regression lineaire
La Regression lineaireLa Regression lineaire
La Regression lineaire
 
[Gestion des risques et conformite] de bale ii à bale iii
[Gestion des risques et conformite] de bale ii à bale iii[Gestion des risques et conformite] de bale ii à bale iii
[Gestion des risques et conformite] de bale ii à bale iii
 
Etude, dimensionnement, calcul des structures et conception d’une empileuse s...
Etude, dimensionnement, calcul des structures et conception d’une empileuse s...Etude, dimensionnement, calcul des structures et conception d’une empileuse s...
Etude, dimensionnement, calcul des structures et conception d’une empileuse s...
 
Chapitre2: Sondage aléatoire simple
Chapitre2: Sondage aléatoire simpleChapitre2: Sondage aléatoire simple
Chapitre2: Sondage aléatoire simple
 
Econometrie
EconometrieEconometrie
Econometrie
 
Echantillonnage
EchantillonnageEchantillonnage
Echantillonnage
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Introduction gestion des risques
Introduction gestion des risquesIntroduction gestion des risques
Introduction gestion des risques
 
NOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUE
NOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUENOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUE
NOTION DE L'UTILTITE ESPEREE ET COMPORTEMENT FACE AU RISQUE
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
technique d'enquete
technique d'enquetetechnique d'enquete
technique d'enquete
 
Methodologie des enquete
Methodologie des enqueteMethodologie des enquete
Methodologie des enquete
 
les processus VAR et SVAR
les processus VAR et SVAR  les processus VAR et SVAR
les processus VAR et SVAR
 
Limites classiques de toutes les fonctions 4
Limites classiques de toutes les fonctions 4Limites classiques de toutes les fonctions 4
Limites classiques de toutes les fonctions 4
 
Stat8 Anova
Stat8  AnovaStat8  Anova
Stat8 Anova
 
Ibm spss decision trees
Ibm spss decision treesIbm spss decision trees
Ibm spss decision trees
 
Introduction a l'actuariat: assurance Non Vie
Introduction a l'actuariat: assurance Non VieIntroduction a l'actuariat: assurance Non Vie
Introduction a l'actuariat: assurance Non Vie
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 

Destacado

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal hammamiahlem1
 
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Gael Varoquaux
 
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Nicolas SORHAITZ
 
Aiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibAiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibGael Varoquaux
 
Je configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsJe configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsRonan Amicel
 
Scikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonScikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonGael Varoquaux
 
Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Gael Varoquaux
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLParis, France
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown Cdiscount
 
Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Emeric Tapachès
 
Python et les bases de données non sql
Python et les bases de données non sqlPython et les bases de données non sql
Python et les bases de données non sqlbchesneau
 
Data Entry in CSpro
Data Entry in CSproData Entry in CSpro
Data Entry in CSproprabhustat
 
pandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statisticspandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and StatisticsWes McKinney
 
pandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Pythonpandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for PythonWes McKinney
 
Simple big data, in Python
Simple big data, in PythonSimple big data, in Python
Simple big data, in PythonGael Varoquaux
 
Chap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonChap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonMohammed TAMALI
 

Destacado (20)

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal
 
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
 
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
 
Aiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibAiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblib
 
Je configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsJe configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtools
 
Python et NoSQL
Python et NoSQLPython et NoSQL
Python et NoSQL
 
Scikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonScikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en Python
 
Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016
 
Python packaging
Python packagingPython packaging
Python packaging
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQL
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown
 
Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2
 
Python et les bases de données non sql
Python et les bases de données non sqlPython et les bases de données non sql
Python et les bases de données non sql
 
R versur Python
R versur PythonR versur Python
R versur Python
 
Data Entry in CSpro
Data Entry in CSproData Entry in CSpro
Data Entry in CSpro
 
pandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statisticspandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statistics
 
pandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Pythonpandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Python
 
Simple big data, in Python
Simple big data, in PythonSimple big data, in Python
Simple big data, in Python
 
Slides udm-080910
Slides udm-080910Slides udm-080910
Slides udm-080910
 
Chap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonChap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec python
 

Chapitre4 Les sondages à probabilité inégales

  • 1. Les sondages à probabilités inégales Mahamadou HARO Ingénieur Statisticien Économiste Séminaire de sondage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14
  • 2. Plan de la présentation 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14
  • 3. Principe Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14
  • 4. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 5. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. A l’intérieur d’un sondage à probabilités inégales on peut distinguer deux cas selon le mode de tirage des unités. Dans le cas d’un tirage avec remise, la probabilité de tirage est souvent proportionnelle à une mesure de taille et il est possible de calculer les estimations ainsi que les précisions. Par contre le mode de tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 6. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. A l’intérieur d’un sondage à probabilités inégales on peut distinguer deux cas selon le mode de tirage des unités. Dans le cas d’un tirage avec remise, la probabilité de tirage est souvent proportionnelle à une mesure de taille et il est possible de calculer les estimations ainsi que les précisions. Par contre le mode de tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 7. Formules d’estimation dans le cas avec remise Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14
  • 8. Formules d’estimation dans le cas avec remise Formules d’estimation dans le cas avec remise Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacun des tirages et on tire un échantillon de taille n. On a N α=1 Aα = 1 (donc chaque Aα , est inférieur à 1 et souvent de valeur très faible). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14
  • 9. Formules d’estimation dans le cas avec remise Estimation d’un total L’estimateur du total de la variable Y (sur l’univers) proposé à partir de l’échantillon tiré est : ˆT(Y) = 1 n n i=1 yi Ai (1) Où yi est la valeur de la variable Y pour l’unité sélectionnée au ième tirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tient donc compte des probabilités de tirage différentes pour produire l’estimation du total. Cet estimateur est sans biais : E(ˆT(Y)) = N α=1 Yα Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14
  • 10. Formules d’estimation dans le cas avec remise Estimation d’une moyenne, d’un ratio Pour estimer la moyenne Y on utilise l’estimateur ˆT(Y) N Sa variance est : V ˆT(Y) N = 1 N2 V(ˆT(Y)) Un ratio est estimé comme le rapport de l’estimation de deux masses. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14
  • 11. Méthodes de tirage Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14
  • 12. Méthodes de tirage Méthodes de tirage Méthode des chiffres cumulés ; Méthodes aréolaires utilisant des grilles de points. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
  • 13. Méthodes de tirage Méthodes de tirage Méthode des chiffres cumulés ; Méthodes aréolaires utilisant des grilles de points. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
  • 14. Aperçu sur le sondage à probabilités inégales sans remise Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14
  • 15. Aperçu sur le sondage à probabilités inégales sans remise Aperçu sur le sondage à probabilités inégales sans remise Le modèle qui a été appliqué précédemment pour produire un estimateur est beaucoup plus difficile à utiliser : en effet, les probabilités de tirage se déforment au fur et à mesure qu’on réalise les tirages. Au premier tirage A1 i = Ai ; Au deuxième tirage A2 j = A1 j 1−A1 i sachant que c’est i qui a été tiré au premier tirage ; etc. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14
  • 16. Aperçu sur le sondage à probabilités inégales sans remise L’estimateur de Howitz-Thompson On fait donc appel à une autre approche, que nous présenterons rapidement : celle de Horvitz-Thompson. Le point de départ de cette approche développée pour les tirages sans remise est la probabilité d’inclusion : Πi probabilité que i appartienne à l’échantillon, Πij probabilité que i et j) soient simultanément dans l’échantillon. Remarquons que si l’échantillon s est de taille fixe n, alors : N α=1 Πα = n L’estimateur de Horvitz-Thompson du total est ˆT(Y) = i∈s yi Πi Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
  • 17. Aperçu sur le sondage à probabilités inégales sans remise L’estimateur de Howitz-Thompson On fait donc appel à une autre approche, que nous présenterons rapidement : celle de Horvitz-Thompson. Le point de départ de cette approche développée pour les tirages sans remise est la probabilité d’inclusion : Πi probabilité que i appartienne à l’échantillon, Πij probabilité que i et j) soient simultanément dans l’échantillon. Remarquons que si l’échantillon s est de taille fixe n, alors : N α=1 Πα = n L’estimateur de Horvitz-Thompson du total est ˆT(Y) = i∈s yi Πi Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
  • 18. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
  • 19. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Certains auteurs ont, par ailleurs, proposé des formules d’approximation de la variance de l’estimateur de Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche est une approche générale, pas seulement limitée aux sondages à probabilités inégales ; elle est présentée dans ce chapitre car étant la seule utilisable quand on tire à probabilités inégales sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
  • 20. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Certains auteurs ont, par ailleurs, proposé des formules d’approximation de la variance de l’estimateur de Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche est une approche générale, pas seulement limitée aux sondages à probabilités inégales ; elle est présentée dans ce chapitre car étant la seule utilisable quand on tire à probabilités inégales sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14