Statistiek en de Iraanse verkiezingen

Inmiddels lijkt duidelijk dat er met de Iraanse verkiezingsuitslagen geknoeid is. De vraag is of dat ook statistisch valt aan te tonen.

Als mensen getallen uit hun duim gaan zuigen, dan zorgen ze er bewust dan wel onbewust voor dat alle cijfers ongeveer even vaak voorkomen, dus de 1 net zo vaak als de 2 net zo vaak als de 3 etcetera.

De werkelijkheid is echter niet zo willekeurig. Als je kijkt naar getallen uit de echte wereld, aandelenkoersen, nationale inkomens, bevolkingsaantallen, stemmen in een verkiezing, dat soort dingen, dan blijken die getallen in ruwweg 30% van de gevallen te beginnen met een 1, in 17% van de gevallen met een 2 en in slechts zo’n 5% van de gevallen met een 9. Die reeks kansen staat bekend als Benford’s Law en heeft te maken met het feit dat veel fenomenen in de echte wereld logaritmisch groeien. Verzin maar eens een willekeurig getal, schrijf dat op een papiertje, tel er zeg 5% bij op, doe dat pakweg duizend keer en zo’n 30% van de resulterende getallen zal beginnen met een 1.

Benford’s Law is ideaal om fraude op te sporen. Het schijnt gebruikt te worden door belastinginspecteurs. En inderdaad, even Googelen levert op dat ook de Iraanse verkiezingsuitslag aan deze analyse [pdf] is onderworpen. Uitkomst: de kans dat de verkiezingsuitslag niet uit de duim is gezogen is minder dan 0.7%. Dit bericht geeft een mooie samenvatting van de analyse, maar plaatst ook wat kanttekeningen.

Huizenprijzen Amsterdam 11% gedaald!?

Eerder deze week leek de kredietcrisis toch fors toe te slaan op de Nederlandse huizenmarkt. De huizenprijzen in Amsterdam zijn in een jaar tijd met 11% gezakt, meldde onder meer de Telegraaf. Tijd voor paniek!

Niet dus. Wie achter dat cijfer kijkt, ziet dat er eigenlijk weinig aan de hand is. De gemiddelde prijs van huizen die verkocht zijn in januari en februari 2009 is 11% lager dan de gemiddelde prijs van huizen die verkocht zijn in januari en februari 2008. En dat is iets volstrekt anders dan de suggestie dat alle huizen in Amsterdam 11% minder waard zijn geworden.

Want wat is er aan de hand? Dure huizen worden op dit moment even niet verkocht. Maar kopers storten zich massaal op het goedkopere segment. Zo massaal dat in sommige wijken ‘de huizenprijzen’ zelfs gestegen zijn. En, tja, de rijtjeshuizen die op dit moment verkocht worden leveren nu eenmaal minder op dan de grachtenpanden die vorig jaar nog van de hand gingen. De prijsdaling per vierkante meter is bijvoorbeeld ook al een stuk lager: -6.4%, en dat cijfer is nog steeds vertekend door andere kwaliteitsaspecten waarmee geen rekening wordt gehouden.

Huizen die verkocht worden zijn nu eenmaal geen representatieve steekproef van de gehele huizenvoorraad. Op dit moment zeker niet. Maar het is wel waar gegevens over ‘de huizenprijzen’ op gebaseerd zijn.

Meer banen, toch crisis

De logica in de economie is soms ver te zoeken. Neem nou dit bericht in de Telegraaf, gebaseerd op deze persverklaring van het CBS:

Het aantal banen groeit door. In het vierde kwartaal van afgelopen jaar waren er 108.000 banen van werknemers meer dan in hetzelfde kwartaal in 2007.

‘Ja maar, het is toch crisis?’ vraagt de leek zich af. Is ook zo. Maar het aantal banen van werknemers is een slechte statistiek om de voortgang van de crisis mee te volgen. Kijk maar eens naar deze data.

Er waren eind 2008 zo’n 108.000 banen meer dan eind 2007. Dat was mooi, maar er waren ook 110.000 extra mensen die wilden werken. Deze ‘mutatie beroepsbevolking’ treedt op omdat er nog wat groei zit in de cohorten 20-64 (die groep neemt toe met zo’n 20.000 mensen) en omdat mensen toetreden na bijvoorbeeld een studie, of minder met vervroegd pensioen gaan. En dus neemt de werkloosheid vanaf de zomer toe, ondanks het grotere aantal banen. Die werkloosheid is een veel betere peilstok voor de ontwikkeling van de recessie (en voor de conjunctuur in het algemeen, zie bijvoorbeeld hier).

Nog wat verdere details voor de liefhebbers. De werkloosheid neemt sneller toe dan het verschil tussen 108 en 110 duizend; hier wreekt zich het feit dat het over werknemers gaat waardoor failliete ondernemers en zzp’ers niet meetellen als banenverlies. En het is vrij normaal dat er banen bijkomen als meer mensen toetreden tot de arbeidsmarkt. Wie denkt dat een vast aantal banen  wordt verdeeld begaat de lump of labor fallacy.

De president en de econometrist

Voor Sinterklaas kreeg ik het boek De herovering van de Amerikaanse droom, een memoire van Barack Obama over zijn belevenissen in de Amerikaanse politiek. Toen ik het gisteren eindelijk doorbladerde (het boek ligt in een hoge stapel nog te lezen) bleef mijn oog opeens hangen. Bovenaan pagina 111 prijkt, geloof het of niet, een vergelijking.

Meneer Hull beschouwde zijn bedrevenheid met cijfers trouwens als een groot voordeel. Op een gegeven moment tijdens de campagne onthulde hij tegenover een journalist een wiskundige formule die hij had ontwikkeld om verkiezingen te winnen, een algoritme dat begon met

Kans = 1/(1 + exp( -1 x ( 3,9659056 + (General Election Weight x 1,92380219…)

en verscheidene onbegrijpelijke factoren later eindigde.

Obama heeft het hier over zijn tegenstander in de campagne om senator te worden, ene Blair Hull. De econometrist herkent in meneer Hull natuurlijk meteen een collega die een logit-vergelijking heeft geschat op de kans dat een willekeurige burger zijn of haar stem op hem uit zal brengen. Daar is niets onbegrijpelijks aan. Maar wat waren de andere regressoren?

Het artikel van de journalist waar Obama over spreekt staat gelukkig nog steeds on line, lees het hier. Het levensverhaal van Hull is zeker de moeite waard: hij tilde onder meer de casino’s in Las Vegas met behulp van statistiek en werd multi-miljonair op de beurs. Hij verloor slechts van Obama omdat zijn ex-vrouw hem vlak voor de verkiezingen dwars zat.

En wat zegt de nieuwe president, nadat hij kennis heeft genomen van de regressie van zijn tegenstander? “Je kon mijn opponent dus gerust afschrijven.” En bedankt.

Olympische Spelen

U heeft het waarschijnlijk al gehoord. Aanstaande vrijdag beginnen de Olympische Spelen en Nederland gaat 20 medailles halen, vier keer goud, zeven keer zilver en negen keer brons. Tenminste, volgens economen Kuper en Sterken in de ESB van anderhalve week geleden. Voor wie er toegang toe heeft, staat het oorspronkelijke artikel hier. De voorspelling is gebaseerd op uitslagen van wereldkampioenschappen enerzijds, en anderzijds een model gebaseerd op dingen als het gemiddeld inkomen, aantal inwoners en aantal deelnemers. Het Parool schrijft er vandaag weer over. En hier legt Elmer Sterken het allemaal nog eens uit aan Humberto Tan bij Radio 538.

Het gaat steeds minder beter

Premier Balkenende vindt dat er in Nederland te veel geklaagd wordt. Als je in de Volkskrant van vanochtend leest over de laatste werkloosheidscijfers, zou je hem haast gelijk gaan geven.

De werkloosheid is sinds 2002 niet meer zo laag geweest. Dat is goed nieuws, zou je zeggen. Maar de Volkskrant weet er toch nog een negatieve draai aan te geven:

Het tempo waarmee de werkloosheid daalt, neemt af. […] In de eerste helft van 2007 telde Nederland elke maand 7.000 werklozen minder. Dit jaar zijn dat er 3.000 per maand. […] De daling van de werkloosheid per maand is met 57 procent verminderd. Volgens Michiel Vergeer, econoom van het CBS, had dat nog erger [sic] kunnen zijn als de kredietcrisis in Nederland diepere sporen had nagelaten.

Anoniem

Gister kwam ie al voorbij in de rechterkolom, het bericht dat de gemeente Nijmegen stopt met anoniem solliciteren omdat het experiment mislukt zou zijn. Vandaag komt de Volkskrant met wat meer informatie:

Tijdens het experiment werden de brieven bij de helft van de gemeentelijke diensten weggelakt. Bij de diensten waar geen gegevens waren weggelakt werden minder allochtone (9 procent) dan autochtone (16 procent) sollicitanten uitgenodigd voor het eerste gesprek. Bij de diensten met de weggelakte gegevens werden evenveel allochtonen als autochtonen uitgenodigd (10 procent).

Uit de context valt niet op te maken of dat een statistisch significant verschil is, maar dat moet haast wel. 16 procent of 10 procent, dat scheelt nogal wat. Maar het bericht gaat verder:

De gemeente Nijmegen durfde het niet aan dit verschil te duiden. Het zou toeval kunnen zijn, of een onbewuste voorkeur voor briefstijlen. Misschien waren leidinggevenden alerter door het experiment.

Tja, dat hadden ze natuurlijk vantevoren moeten bedenken. Als dat echt een bezwaar is, dan had het experiment beter opgezet moeten worden. Uitkomsten van een dergelijk onderzoek kunnen altijd toeval zijn, maar daar hebben we betrouwbaarheidsintervallen voor. Het argument “het zou toeval kunnen zijn”, is dus weinig valide. We gaan verder:

Daarom werd besloten tot een tweede meting. Die maakte duidelijk dat het bij de ene helft van gemeentelijke diensten niet uitmaakt of de namen van allochtonen wordt weggelakt en bij de andere helft wel.

Als er bij de helft een effect nul is, maar bij de andere helft een positief effect, dan lijkt me voor de hand te liggen dat het totale effect wel degelijk positief is.

Het heeft er alle schijn van dat het experiment niet mislukt is, maar dat de gemeente Nijmegen niet durft toe te geven dat haar medewerkers discrimineren.

Mijn eigen inflatie

De Engelse versie van het CBS heeft een Personal Inflation Calculator die precies doet wat de naam zegt. De gebruiker vult zijn gehele financiële huishouding in, hoopt dat het CBS de data niet doorverkoopt en ziet precies berekend wat er is gebeurd met de prijs van zijn/haar consumptiemandje. Klachten dat de statistici met verkeerde inflatiecijfers komen zijn hiermee verleden tijd. En kijk aan, ook het Nederlandse CBS gaat per april een versie van de PIC aanbieden.

Het invoeren van budgetaandelen van aardappelen, benzine en computers is veel werk, maar misschien nog wel vervelender is dat die aandelen gaan schuiven, juist op het moment dat de prijzen van artikelen op de loop gaan. Nu de benzine duurder is wordt er minder getankt, om maar eens wat te noemen. De echte inflatiecijfers houden daar rekening mee maar ik zou niet weten hoe de PIC dat zou moeten doen. En dan is nog maar de vraag welk nut het persoonlijke cijfer dient. De echte inflatie is de belangrijkste indicator voor het rentebeleid van de ECB, de persoonlijke inflatie een aardigheidje.

Maar uiteindelijk heeft wie wil weten wat er met zijn eigen koopkracht gebeurt een veel beter instrument tot zijn beschikking: bij ongewijzigd inkomen en gedrag voldoet het banksaldo aan het eind van de maand.

Vraag en aanbod

(Voor een weblog met het woord economie in de naam hebben we te weinig berichten met de titel vraag en aanbod. Hier is er een.)

De economische groei over 2007 is hoger uitgevallen dan verwacht. Waar men voorheen op 3 procent rekende, stond de teller volgens het CBS uiteindelijk op 3,5 procent. Wat nu met de groei van 2008?

Directeur Coen Teulings van het Centraal Planbureau (CPB) noemt het ‘onvermijdelijk’ dat dit jaar de economie harder groeit dan 1,75% [de eerder voorspelde groei, red.].

en

DNB-directeur Henk Brouwer stelde in zijn introductiespeech als nieuw kroonlid van de SER dat de economie nu nog profiteert van een overloopeffect van de hogere groei in 2007.

Tja, dat zijn wijze mannen met grote namen. Maar klopt het ook, dat wil zeggen, is de groei dit jaar hoger als die vorig jaar ook hoger was? Je kunt je ook voorstellen dat de economie in deze cyclus tot een bepaald efficiëntieniveau kan komen; als we er vorig jaar al dichterbij zijn gekomen dan verwacht, dan zal de groei dit jaar tegenvallen. Dat is de logica van de snelweg: als we al om 10 uur bij Eindhoven zijn, dan is de overgebleven tijd tot Maastricht niet zo lang meer.

Dit zijn de (nominale) groeicijfers van de afgelopen 15 jaar. De autocorrelatie is 0,63 wat erop duidt dat een jaar met hoge groei inderdaad gevolgd wordt door nog een jaar met hoger dan gemiddelde groei (en omgekeerd). Maar waarom?

groei.gif

Het is het verschil tussen een vraag- en aanbodbenadering. De logica van de snelweg gaat uit van het aanbod: de efficiëntie van producenten neemt toe en dus het BBP. De logica van de directeuren is die van Keynes: de hoge groei in 2007 zorgt voor geld in de zakken en dus voor extra vraag in 2008. Dat klopt misschien wel op korte termijn, maar over meerdere jaren moet dat een keer ophouden. Daarom is het zaak, zegt men, de overschotten te gebruiken om het aanbod op termijn te verhogen, door nu hervormingen door te voeren. Verstandige woorden.

update 21/2: Het overloopeffect, een term die hierboven valt, blijkt een verschijnsel dat voortkomt uit het feit dat er jaar-op-jaar groei gemeten wordt en niet noodzakelijk doordat er een soort traagheid in de groeivoet zit. Een CPBer mailt

[Stel dat de groei] eind december 2007 bijna 1,8% hoger was dan het gemiddelde over heel 2007. Als productiviteit en werkgelegenheid constant blijven op het niveau van 2007 (eigenlijk dus nulgroei in 2008 via de aanbodkant), is het gemiddelde over het jaar 2008 dus toch 1,8% hoger dan in 2007. En dat is de groeivoet die voorspeld moet worden.

Is het daarom toch aanbod in plaats van vraag? Hmm, ik zou zeggen: meetfout. Toch, weer wat geleerd.

Wit of blauw?

Een centrale vraag in de judometrie, zo leerden wij vorige week, is of de kleur van het pak invloed heeft op de uitslag van een wedstrijd. De heersende opinie scheen te zijn dat mannen in witte pakken een nadeel hebben ten opzichte van mannen in blauwe pakken, maar recent onderzoek, onder meer van ene Peter Dijkstra, suggereert anders. Voor de details moeten we ons wenden tot de buitenlandse pers. Reuters heeft het hele verhaal:

However, Dijkstra said those [earlier] studies did not take into account that higher seeded — and therefore more skilled — competitors wore the blue uniforms. So it made sense that they would win more often, he said.

Moment. De eerdere studies hielden er geen rekening mee dat sporters die hoger op de wereldranglijst staan nu eenmaal vaker een blauw pak dragen? Ja maar, ja maar, zouden ze niet juist zo hoog staan omdat ze altijd in een blauw pak strijden? Met andere woorden, het probleem van causaliteit lijkt hier nog steeds niet mee opgelost.

Ook sluit ik niet uit dat de optimale pakkeuze van de tegenstander afhangt. Tegen sommige tegenstanders is misschien een wit pak slimmer, tegen ander een blauw. Om die reden adviseer ik dan ook dit pak.

Wat zegt u? Judo heeft niets met economie te maken? Jawel hoor, kijk maar eens hier.