Correlatie en oorzaak

Steve Dubner, een van de auteurs van Freakonomics, is enthousiast over de nieuwe service Swivel. Op die site kunnen gebruikers data uploaden, waarna anderen het ook kunnen bekijken, er grafieken van gemaakt worden en, en daar gaat het om, er automatisch gecorreleerd wordt met andere data.

Op die manier kun je, zo is de gedachte, interessante patronen ontdekken. Zoals deze: als de temperatuur heel hoog of heel laag is, gaat het energieverbruik omhoog. Maar dan natuurlijk iets onverwachts.

Aan de ene kant opent dit de deur voor de amateur-analyticus, zoals Google Earth dat deed voor de amateur-archeoloog. Dat lijkt inderdaad goed nieuws. Aan de andere kant kun je zo weinig afleiden uit correlatie, het gegeven dat twee grootheden met elkaar meebewegen. Als eerstejaars student kreeg ik, om dat duidelijk te maken, grafieken te zien van het Nederlands geboortecijfer over de jaren en van het jaarlijks aantal geobserveerde ooievaars. Perfecte correlatie: beiden gingen sinds 1950 strak naar beneden. Het probleem zat ‘m in de interpretatie.

Auteur: Thijs

Econoom. Krantenlezer. Stuurman aan wal.