Statistiek en de Iraanse verkiezingen

Inmiddels lijkt duidelijk dat er met de Iraanse verkiezingsuitslagen geknoeid is. De vraag is of dat ook statistisch valt aan te tonen.

Als mensen getallen uit hun duim gaan zuigen, dan zorgen ze er bewust dan wel onbewust voor dat alle cijfers ongeveer even vaak voorkomen, dus de 1 net zo vaak als de 2 net zo vaak als de 3 etcetera.

De werkelijkheid is echter niet zo willekeurig. Als je kijkt naar getallen uit de echte wereld, aandelenkoersen, nationale inkomens, bevolkingsaantallen, stemmen in een verkiezing, dat soort dingen, dan blijken die getallen in ruwweg 30% van de gevallen te beginnen met een 1, in 17% van de gevallen met een 2 en in slechts zo’n 5% van de gevallen met een 9. Die reeks kansen staat bekend als Benford’s Law en heeft te maken met het feit dat veel fenomenen in de echte wereld logaritmisch groeien. Verzin maar eens een willekeurig getal, schrijf dat op een papiertje, tel er zeg 5% bij op, doe dat pakweg duizend keer en zo’n 30% van de resulterende getallen zal beginnen met een 1.

Benford’s Law is ideaal om fraude op te sporen. Het schijnt gebruikt te worden door belastinginspecteurs. En inderdaad, even Googelen levert op dat ook de Iraanse verkiezingsuitslag aan deze analyse [pdf] is onderworpen. Uitkomst: de kans dat de verkiezingsuitslag niet uit de duim is gezogen is minder dan 0.7%. Dit bericht geeft een mooie samenvatting van de analyse, maar plaatst ook wat kanttekeningen.