Kollektiv visdom på Facebook

I 1907 blev der i tidsskriftet Nature publiceret en artikel, der analyserede, hvor kompetente folk var til at gætte vægten på en over halvt ton tung okse. Konklusionen var, at folkemængden samlet set kunne levere et fornuftigt estimat på vægten af oksen. Ved at udregne medianværdien på baggrund af de i alt 787 gæt, fik man en værdi der lå kun 0,8 pct. af oksens samlede vægt fra dens reelle vægt. Det pågældende gæt var ikke så overraskende langt bedre end størstedelen af de gæt, der blev afgivet.

Studiet blev – sammen med andre eksempler på at beslutninger truffet på baggrund af aggregreret information i grupper kan være bedre end individuelle beslutninger – gjort mainstream med James Surowieckis The Wisdom of Crowds fra 2005, og i de senere år har forskere blandt andet været interesseret i at undersøge, hvad der kan påvirke sådanne beslutninger.

I torsdags havde Egekilde en konkurrence på deres facebook-side, der gik ud på at gætte, hvor mange chokoladepåskeæg der kan være i en Egekilde-vandflaske (den der er afbilledet til højre). Jeg satte mig for, efter at konkurrencen var afsluttet, at hente alle kommentarer afgivet til konkurrencen ned fra facebook, og se nærmere på, hvor mange der gættede korrekt. Ideen var med andre ord at undersøge, hvor mange der kom i nærheden af det rigtige gæt og hvordan svarene lå fordelt omkring dette. Problemet viste sig dog at være – til min store overraskelse – at ikke alt hvad der skrives som kommentarer på facebook, giver mening.

For at ende med de meningsfulde gæt og fjerne al støj, fjernede jeg tekst, smileys og andre tegn samt intervalgæt (gæt som 45-46 og 63-64). Dernæst valgte jeg at fjerne bud, der åbenlyst var alt for høje og alt for lave gæt (det højeste gæt var mange cifre langt og det laveste gæt var negativt). Konkret valgte jeg, at gættet skulle være tocifret og større end 30, da man kan se mindst 30 chokoladeæg på billedet alene ved at tælle. Dette giver os sammenlagt 6.884 valide gæt. 184 af konkurrencedeltagerene gættede korrekt (der var 56 chokoladeæg i flasken, jf. Egekilde).

Kigger vi på gennemsnittet, der er vist med den stiplede blå linje i ovenstående figur, ligger det omkring fire æg under de 56. Det kunne ligge tættere på det korrekte svar, men det er slet værst. Det mest populære gæt var 50 påskeæg (435 konkurrencedeltagere afgav det bud). Dette harmonerer fint med, at vi har en forkærlighed for runde tal.

Som nedenstående figur viser, var gennemsnittet på intet tidspunkt i konkurrencen tæt på de 56 chokoladeæg. Der kan være gode grunde til, at gennemsnittet ligger lavere end de 56. En potentiel forklaring kan være, at antallet af synlige æg fungerer som et anchor, som hver deltager så tilføjer flere chokoladeæg til, når der skal afgives et bud. Havde der ikke været nogle æg i flasken, ville gennemsnittet (i den reducerede sample med de tocifrede gæt over 30, forstås) måske have været større. Ligeledes er det muligt at præmien, 24 flasker Egekilde, har fungeret som et anchor. Hvis præmien havde været 96 flasker Egekilde, havde gennemsnittet derfor måske været større.

Havde jeg brugt ovenstående materiale til at afgive et bud på 52, havde jeg end ikke været med i lodtrækningen om at vinde 24 flasker Egekilde (jeg deltager aldrig i konkurrencer, så ingen skade sket). Jeg ville dog komme langt tættere på et korrekt svar end størstedelen af de andre konkurrencedeltagere, der deltog i Egekildes konkurrence. Så næste gang du finder en lignende konkurrence med offentlige svar fra andre konkurrencedeltagere, kan du med rette finde lommeregneren frem og komme i nærheden af det korrekte svar.