Complexe econometrie

De beste inzichten komen op latere leeftijd, en dus is het verstandig om even naar deze presentatie van Paul Krugman [pdf] te kijken. De econoom en columnist, die binnenkort 63 wordt, doet een opmerkelijk levensinzicht aan de hand: complexe econometrie overtuigt niemand. En complexe econometrie begint voor Krugman bij lineaire regressie met meerdere variabelen, een methode die op de middelbare school onderwezen wordt.

Dat is slecht nieuws, niet in het minst voor mensen die jaren van hun leven hebben besteed aan het onder de knie krijgen van complexe econometrie (ahem). Maar klopt het ook?

In ieder geval is het doel van econometrie niet altijd overtuigen. Soms werkt een complex model gewoon, zoals een handelsalgoritme of een model dat beslissingen neemt voor een verzekeraar. Dat de meeste mensen niet begrijpen hóe het werkt, laat staan overtuigd zijn, dat maakt niet uit – het model draait, net zoals de motor in mijn auto, zonder dat ik helemaal begrijp waarom.

Krugman probeert wél te overtuigen, vooral op het specifieke terrein van de macro-economie. Daar is de scepsis wellicht groter dan elders, omdat de data niet altijd heel goed is, en er veel afhangt van de keuzes die de econometrist maakt. Toch is het nogal onbevredigend dat zelfs zijn slimme collega’s een model niet overtuigend vinden als dat ingewikkelder is dan een simpel lineair verband.

Maar het raakt wel een snaar. Ook in Nederland zien we dat de tijd van “het model zegt nu eenmaal” voorbij is, en het CPB op de knieën moet uitleggen waar bepaalde inzichten vandaan komen. Het respect voor de onderzoeker, die het wel zal weten, is verdwenen. Dat is jammer, voor de onderzoeker, maar niet helemaal onterecht.

Wat is eraan te doen? Krugman zoekt de oplossing in “natuurlijke experimenten”, wat in zijn slides een verzameling puntenwolken, tijdreeksen en verdelingen is, en in “verrassende voorspellingen die uitkomen”. Dat laatste is een echo van Milton Friedman, die theorieën ook al beoordeelde op het vermogen om voorspellingen te genereren. Dat biedt enige hoop, want ook een complex model kan simpele voorspellingen doen. Alleen lijkt het nogal inefficiënt, omdat er altijd tijd zal zitten tussen de voorspelling en het resultaat. Krugman hoopt nu eindelijk zijn gelijk te halen over een analyse van 7 jaar geleden.

Ik heb zelf mijn hoop gevestigd op een betere oplossing. Aangenomen dat complexe econometrie soms nuttige inzichten oplevert, is er een voordeel te behalen voor degene die de moeite neemt om de resultaten te begrijpen. Nu het makkelijk is om datasets en computercode te delen, kan dat ook.  Het feit dat “niemand” overtuigd wordt door een complexe analyse biedt een voordeel aan degene die wél kan doorgronden of de econometrist een punt heeft. Een goede reden om een eigen econometrist in huis te halen.

Unanimiteit misleidt

Stel iemand wordt verdacht van moord en u moet bepalen of hij daarvoor gestraft gaat worden. Gelukkig heeft u de beschikking over een panel van onafhankelijke en uitstekende rechters. Om precies te zijn, elke rechter doet met een kans van 70% de juiste uitspraak. Toegegeven, ze zitten er nog wel eens naast, maar u heeft de beschikking over een flink aantal en in het kader van de wisdom of the crowd moet u dus eenvoudig tot een uitstekende beslissing kunnen komen.

Stel dat 3 rechters unaniem tot de conclusie komen dat verdachte schuldig is. Dat lijkt al voldoende voor een veroordeling. En bij 5 unanieme rechters weet u het helemaal zeker.

Maar bij 10 unanieme rechters begint u zich toch een beetje ongemakkelijk te voelen. Zelfs als verdachte schuldig, dan is de kans dat alle 10 rechters unaniem en onafhankelijk van elkaar tot die conclusie komen slechts 0.7 tot de macht 10, dus 2.8%. En bij 20 unanieme rechters weet u het zeker. Hier is iets niet in de haak. De kans daarop, zelfs bij schuld, is immers minder dan 0.1%.

Gunn et al.  (via) introduceren de mogelijkheid van een systeemfout. In dit geval betekent een systeemfout dat iemand die onschuldig is zonder meer door iedereen schuldig wordt verklaard. Dat kan veel oorzaken hebben. Misschien is er met het bewijsmateriaal geknoeid. Of zijn de rechters een corrupt zootje. Of is er iets anders mis gegaan. Veronderstel voor het gemak eens dat de kans op een systeemfout 1% is.

Ineens ziet de wereld er heel anders uit. Bij 10 unanieme rechters weten we dat de kans dat dat toevallig gebeurt 2.8% is. Maar we kennen ook de kans op een systeemfout: 1%. Middels Bayesian updating vinden we dan een kans van ongeveer  1/(1+2.8)=26% dat de verdachte onschuldig is. En bij 20 unanieme rechters is die kans zelfs 93%. Paradoxaal genoeg geldt dat hoe meer unanieme rechters er zijn, des te groter de kans is dat verdachte onschuldig is. Immers: hoe meer unanieme rechters, hoe kleiner de kans dat dat op toeval berust, en hoe groter de kans dat er iets echt niet in de haak is. Maar als er een rechter is die verdachte onschuldig  vindt, maakt dat de kans dat hij schuldig is juist veel groter. Er kan nu immers geen sprake meer zijn van een systeemfout.

Wanneer in Israel een panel van 23 rechters unaniem vond dat de doodstraf gerechtvaardigd was, moest de verdachte volgens de Talmud worden vrijgesproken. Waarschijnlijk was die regel helemaal niet zo gek. Volgens sommige beleggers geldt dat wanneer alle beuranalisten roepen dat de beurs nog veel verder gaat stijgen, het tijd wordt om uit te stappen. En andersom. Bij unanimiteit wordt het tijd je zorgen te gaan maken.

Overigens houdt het artikel geen rekening met de mogelijkheid van strategisch gedrag.