Indicateurs statistiques de
fraude électorale
Ph. Guglielmetti, CEC, 10 mai 2015
Indicateurs statistiques de fraude électorale
1. Loi de Benford
2. Modèle binomial robuste surdispersé
3. Autre indicateur...
1. Loi de Benford
● Surprenant : en mesurant de
nombreuses choses dans la
nature, les nombres commencent
plus souvent par ...
Test statistique “Loi de Benford”
● Pour la détection de fraude on
utilise le 2ème digit, car trop de
locaux ont ~ 1000 vo...
Critique du test de Benford
Si le résultat est > 16.92 on ne sait
pas grand chose car:
1. ça arrive “normalement” dans
5% ...
2. Modèle binomial robuste surdispersé
1. On a comparé les votes OUI /
NON (binomial) des communes
pendant 10 ans
2. On a ...
( Politique à 2 dimensions )
1. Représentation de plus en plus
courante en analyse politique
2. http://smartvote.ch/
3. “W...
Modèle binomial robuste surdispersé
3. Le modèle permet de prévoir les
résultats dans une commune
d’après les résultats da...
Modèle binomial robuste surdispersé
4. Les poids mesurent
la correspondance
avec la tendance
générale.
5. Les résidus sont...
Critique du MBRS
1. “Effectivement, les modèles
avec surdispersion sont
une très bonne idée !!”
(Arthur Charpentier,
prof ...
Autre indicateur de détection de fraude
● Klimek & all (2012). It’s
not the voting that’s
democracy, it’s the
counting: St...
Propositions
1. Représenter les résultats
du MBRS en couleur sur
une carte du Canton
2. Ajouter les graphiques
résultat / ...
Próxima SlideShare
Cargando en…5
×

Indicateurs statistiques de fraude électorale

565 visualizaciones

Publicado el

Présentation à la Commission Electorale du Canton de Genève

Loi de Benford
Modèle binomial robuste surdispersé
Autre indicateur
Propositions

Publicado en: Datos y análisis
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Indicateurs statistiques de fraude électorale

  1. 1. Indicateurs statistiques de fraude électorale Ph. Guglielmetti, CEC, 10 mai 2015
  2. 2. Indicateurs statistiques de fraude électorale 1. Loi de Benford 2. Modèle binomial robuste surdispersé 3. Autre indicateur 4. Propositions
  3. 3. 1. Loi de Benford ● Surprenant : en mesurant de nombreuses choses dans la nature, les nombres commencent plus souvent par 1 que par 2 etc. jusqu’à 9 ● Exemples : population des pays ou longueur des fleuves ● C’est vrai aussi pour le deuxième digit
  4. 4. Test statistique “Loi de Benford” ● Pour la détection de fraude on utilise le 2ème digit, car trop de locaux ont ~ 1000 votants ● le “ test du χ² ” vérifie si le deuxième chiffre du nombre de oui / non des locaux de vote obéit à la loi de Benford ● si le résultat est < 16.92 on est sur à 95% que oui
  5. 5. Critique du test de Benford Si le résultat est > 16.92 on ne sait pas grand chose car: 1. ça arrive “normalement” dans 5% des cas 2. on ne sait pas quel(s) bureau(x) de vote sont concernés La validité du test est fortement contestée dans la littérature lorsqu’il y a peu de bureaux de taille trop similaire Seule cas de fraude que ce test est vraiment capable de détecter: Si quelqu’un génère les résultats à l’aide de la fonction RAND() d’Excel au lieu d’utiliser POWER(10;RAND()) / 10 Ah zut je l’ai dit… Donc ce test est désormais inutile.
  6. 6. 2. Modèle binomial robuste surdispersé 1. On a comparé les votes OUI / NON (binomial) des communes pendant 10 ans 2. On a construit un “modèle robuste” de ces relations selon deux “variables indépendantes” vote comme A B C D A 100% 80% 12% 3% B 80% 100% 36% 22% C 12% 36% 100% 42% D 3% 22% 42% 100% A B C D
  7. 7. ( Politique à 2 dimensions ) 1. Représentation de plus en plus courante en analyse politique 2. http://smartvote.ch/ 3. “Wie sich die SVP aus dem Bürgerblock verabschiedet hat” Tages Anzeiger, 21. April 2014 http://sotomo.ch/
  8. 8. Modèle binomial robuste surdispersé 3. Le modèle permet de prévoir les résultats dans une commune d’après les résultats dans les autres (surdispersion): A B C D OUI 48% ? 80% 52% A B C D Oui
  9. 9. Modèle binomial robuste surdispersé 4. Les poids mesurent la correspondance avec la tendance générale. 5. Les résidus sont les écarts entre le résultat réel et celui prévu par le modèle.
  10. 10. Critique du MBRS 1. “Effectivement, les modèles avec surdispersion sont une très bonne idée !!” (Arthur Charpentier, prof de stats Montréal http://freakonometrics. hypotheses.org/12142 2. “Lorsque l'objet concerne des questions d'ordre géographique, les profils ne seront peut-être pas suffisants pour expliquer les résultats.” 3. Le modèle a été établi sur 10 années (199x-200x) Comment le remettre à jour ? Faut-il le faire en permanence ?
  11. 11. Autre indicateur de détection de fraude ● Klimek & all (2012). It’s not the voting that’s democracy, it’s the counting: Statistical detection of systematic election irregularities 10.1073/pnas.1210722109 ● La participation est une donnée disponible et importante
  12. 12. Propositions 1. Représenter les résultats du MBRS en couleur sur une carte du Canton 2. Ajouter les graphiques résultat / participation 3. (Supprimer Benford) 4. Etudier comment “resetter” ou faire évoluer le MBRS

×