Voor Sinterklaas kreeg ik het boek De herovering van de Amerikaanse droom, een memoire van Barack Obama over zijn belevenissen in de Amerikaanse politiek. Toen ik het gisteren eindelijk doorbladerde (het boek ligt in een hoge stapel nog te lezen) bleef mijn oog opeens hangen. Bovenaan pagina 111 prijkt, geloof het of niet, een vergelijking.
Meneer Hull beschouwde zijn bedrevenheid met cijfers trouwens als een groot voordeel. Op een gegeven moment tijdens de campagne onthulde hij tegenover een journalist een wiskundige formule die hij had ontwikkeld om verkiezingen te winnen, een algoritme dat begon met
Kans = 1/(1 + exp( -1 x ( 3,9659056 + (General Election Weight x 1,92380219…)
en verscheidene onbegrijpelijke factoren later eindigde.
Obama heeft het hier over zijn tegenstander in de campagne om senator te worden, ene Blair Hull. De econometrist herkent in meneer Hull natuurlijk meteen een collega die een logit-vergelijking heeft geschat op de kans dat een willekeurige burger zijn of haar stem op hem uit zal brengen. Daar is niets onbegrijpelijks aan. Maar wat waren de andere regressoren?
Het artikel van de journalist waar Obama over spreekt staat gelukkig nog steeds on line, lees het hier. Het levensverhaal van Hull is zeker de moeite waard: hij tilde onder meer de casino’s in Las Vegas met behulp van statistiek en werd multi-miljonair op de beurs. Hij verloor slechts van Obama omdat zijn ex-vrouw hem vlak voor de verkiezingen dwars zat.
En wat zegt de nieuwe president, nadat hij kennis heeft genomen van de regressie van zijn tegenstander? “Je kon mijn opponent dus gerust afschrijven.” En bedankt.
Ik ken het boek niet, maar je verhaal lijkt niet uit te sluiten dat Obama de slag om het senatorschap op basis van econometrische kennis heeft gewonnen: wellicht heeft hij gezien dat “gedrag van ex-vrouwen” een belangrijke omitted variable in Hull’s logit-regressie was, dat gedrag heeft beïnvloed (hoe ziet haar levensverhaal eruit?!) en daarom nogal zeker wist dat hij goed zat…
Tja. Een enigszins onwetenschappelijke weergave blijft het natuurlijk wel: “een wiskundige formule om verkiezingen te winnen”. Dat moet natuurlijk zijn: “… om de kans op winst te maximaliseren” en dat is heel wat anders. In de logit is de kans altijd kleiner dan 1 en kun je altijd nog verliezen.
Het artikel merkt ook op dat de vergelijking geen rekening houdt met de “X-factor”. In de econometrie noemen we dat liever een storingsterm.