In economenblad ESB staat vandaag een bijzonder intrigerend artikel van Loek Groot en Michel van de Velden over het voorspellen van voetbaluitslagen en, meer concreet, het invullen van de WK-po0l. De auteurs beginnen met wat eenvoudige tips (voorbeeld: als je punten krijgt voor elk goed voorspelde aantal doelpunten dat een team maakt vul dan altijd een 0 in, wat dat is nu eenmaal de meest voorkomende score). Vervolgens geven de auteurs op basis van Poisson parameters en Elo– en Voros-ratings een schatting van winkansen en meest waarschijnlijke uitslagen.
Toch heb ik mijn twijfels of het verstandig is om op basis hiervan je WK-pool in te vullen. De impliciete suggestie (zeker in het artikel op Z24) lijkt dat je de po0l zodanig moet invullen dat je je verwachte score maximaliseert door steeds de meest waarschijnlijke antwoorden te geven (zie bijvoorbeeld ook hier). En volgens mij is dat niet verstandig.
Natuurlijk, wie betaald wordt op basis van de score die hij haalt, moet de meest waarschijnlijke uitkomsten invullen. Maar de meeste pools werken zo niet. Alleen degene met de hoogste score krijgt een prijs. En daarom kan het verstandig zijn om te speculeren door juist niet de meest waarschijnlijke scores in te vullen. Wie op safe speelt zal nooit een uitschieter zijn. En wie geen uitschieter is, zal nooit de pool winnen. Het maximaliseren van de kans op winst is heel iets anders dan het maximaliseren van je verwachte score.
Een eenvoudig voorbeeld. Stel Brazilie heeft 80% om van Ivoorkust te winnen, andersom is de kans 20%. U doet mee aan een pool met 10 deelnemers, waarvan de andere 9 allemaal Brazilie tippen. Dat land heeft immers de grootste kans om te winnen. Wat doet u? Als u ook Brazilie tipt, heeft iedereen dezelfde voorspelling, zal de winnaar willekeurig worden getrokken, en heeft u dus 10% kans de pool te winnen. Maar als u Ivoorkust tipt, dan is er slechts een kans van 20% dat u gelijk heeft, maar als u gelijk heeft, wint u ook zeker de pool. Ergo: de kans dat u de pool wint is dan 20%, en dat is meer dan wanneer u het favoriete Brazilie tipt.
Misschien dat ik toch maar ga inzetten op een finale Japan — Honduras.
Beste Marco,
we zijn het helemaal met je eens dat in het voorbeeld dat je geeft het beter is niet te kiezen voor de meest waarschijnlijke winnaar (Brazilie), maar voor Ivoorkust. Het voorbeeld betreft echter slechts een wedstrijd. Bij de conventionele poules gaat het echter om alle wedstrijden van het WK en alleen al in de poulefase worden 48 wedstrijden gespeeld. Als je in plaats van de meest waarschijnlijke uitslag (gemiddeld met een kans van 15%) elke keer kiest voor een onwaarschijnlijke uitslag, dan heb je het weliswaar bij sommige uitslagen als enige goed, maar in totaal heb je naar verwachting minder wedstrijden goed voorspeld. Het hangt dan af van de spelregels van de poule of de strategie waar jij voor kiest loont. Bijvoorbeeld, bij het laatste EK organiseerde de Volkskrant een poule waarbij elke wedstrijd het aantal te verdienen punten gelijk was aan het aantal deelnemers, gedeeld door het aantal spelers dat de exacte uitslag goed had voorspeld. In zo een poule kan je beter kiezen voor onwaarschijnlijke uitslagen, omdat als je het goed hebt daarmee heel veel punten verdient, terwijl bij een waarschijnlijke uitslag de punten verdeeld worden over heel veel deelnemers die het net zo als jou goed hadden voorspeld.
Bij de conventionele poule echter ligt het anders. Neem de wedstrijd Nederland-Denemarken van gisteren. Volgens onze methode is op basis van de Elo-ratings de meest waarschijnlijke uitslag 1-0 (16%), gevolgd door 2-0 (15%), 3-0 (10%), 1-1 (9%). Als je nu kiest voor zeg 3-2 met een kans van 2%, dan heb je het weliswaar waarschijnlijk als enige goed mocht dat de uitstag zijn geweest, maar over de 48 poulewedstijden lukt dat je waarschijnlijk maar 1 keer, terwijl bij de keuze voor de meest waarschijnlijke uitslag je naar verwachting 15 procent van de 48 wedstrijden goed voorspelt, ofwel 7 correct voorspelde uitslagen.
Niettemin, je hebt een punt met “Het maximaliseren van de kans op winst is heel iets anders dan het maximaliseren van je verwachte score.” In hoeverre dat zo is hangt af van de spelregels van de poule (bijvoorbeeld is het ‘Winner takes all’ of meerdere prijzen) en hoeveel deelnemers er zijn: met slechts een prijs en heel veel deelnemers loont het om meer naar jouw strategie op te schuiven. Voor het inzetten bij wedkantoren werkt onze methode prima.
groet, Loek
Loek,
Dank voor je reactie! (zij het wat laat, excuus) Ik moet toegeven dat een praktische implementatie van mijn advies (met name bij een pool waar het aantal te voorspellen items groot is) nogal lastig te geven is… Uiteindelijk hangt het natuurlijk ook af van wat de andere deelnemers doen zodat het een intrigerend speltheoretisch probleem wordt.
Ik heb daar wel over nagedacht, maar dan wordt het wel heel technisch. Stel dat het invullen van een pool neerkomt op het kiezen van 1 getal tussen 0 en 1 waarbij 1/2 het meest waarschijnlijk is en er een kansdichtheidsfunctie is weer te geven over het hele interval [0,1]. Uiteindelijk is het invullen van de pool door n spelers speltheoretisch dan identiek aan een Hotelling lijn waar n spelers een lokatie moeten kiezen. Helaas bestaat er voor dat spel vaak geen Nash evenwicht, of hooguit een in gemengde strategieen. Qua concrete invultips voor de volgende WK-pool levert dat dus ook bitter weinig op…