Meningsmålinger på Politologi.dk #4

I mit forrige indlæg omkring meningsmålinger på Politologi.dk introducerede jeg en række større ændringer og tilføjelser. I dette indlæg vil jeg gøre det samme: introducere de seneste nævneværdige ændringer, jeg har foretaget på Politologi.dk.

Bedre konfidensintervaller

Det har længe irriteret mig, at den statistiske usikkerhed for et parti med en opbakning på 0% er nul. Dette på grund af den måde den statistiske usikkerhed udregnes, når vi anvender en approksimation af binomialfordelingen ved hjælp af normalfordelingen. I praksis ved vi dog, at blot fordi Veganerpartiet eller Frie Grønne står til at få 0% i en meningsmåling, er vi ikke sikre på, at deres opbakning vil være 0%.

Nedenstående figur viser et eksempel på, hvordan opbakningen så ud for Veganerpartiet i meningsmålingerne. Bemærk hvordan den statistiske usikkerhed, når opbakningen er på 0%, er nul.

For at adressere dette har jeg valgt at ændre konfidensintervallerne til Clopper-Pearson konfidensintervaller. De er mindre intuitive at udregne i hånden, men de er så godt som identiske med de ‘normale’ konfidensintervaller (se denne side for mere information omkring styrker og svagheder).

Her er et eksempel på, hvordan de nye konfidensintervaller ser ud for Veganerpartiet.

Den primære ændring er, at der nu ikke er partier, der har en statistik usikkerhed på 0, blot fordi deres opbakning er 0%. Dette gør den visuelle præsentation af den statistiske usikkerhed for små partier bedre.

Det skal nævnes at usikkerheden er så godt som identisk for de større partier, hvorfor det primært er for netop at få bedre konfidensintervaller for de meget små partier, at disse ændringer er lavet.

Statistisk usikkerhed på alle figurer

Det er altid godt at vise den statistiske usikkerhed, når man formidler meningsmålinger. Jeg har i figurer med alle partier haft for vane blot at vise punktestimaterne uden statistisk usikkerhed, da det let kunne blive for voldsomt, hvis der også skulle vises statistisk usikkerhed for mange målinger. Nedenstående figur viser et eksempel på, hvordan det har set ud tidligere.

Jeg har fundet et fornuftigt kompromis, hvor den statistiske usikkerhed vises, men uden at den står meget klart. Nedenstående figur viser den opdaterede figur, hvor jeg har tilføjet 95% konfidensintervaller.

Den statistiske usikkerhed vises således på alle figurer med meningsmålinger. Det vil være et princip fremover ikke at vise nogle estimater fra meningsmålingerne uden også at vise den statistiske usikkerhed.

Moderaterne

Moderaterne er nu med i det vægtede gennemsnit. Partiet blev inkluderet da alle analyseinstitutter valgte at inkludere partiet i deres målinger. Jeg har tidligere skrevet om, hvordan der var stor forskel på, hvornår de forskellige institutter valgte at inkludere partiet. Det første vægtede snit giver partiet en opbakning på 2,8% procent.

Der er en relevant pointe at tilføje her. Ovenstående figur illustrerer vigtigheden af at have den statistiske usikkerhed med i de vægtede gennemsnit. Der er stor forskel på de forskellige vægtede snit i forhold til, om de formidler usikkerhed (noget jeg har skrevet om her). Bemærk at selvom opbakningen til Moderaterne og Liberal Alliance ligger på det samme niveau, er vi langt mere sikre på, at Liberal Alliance står til en opbakning på 2,7%, hvor Moderaterne kan befinde sig et under spærregrænsen såvel som et godt stykke over den. Hvis vi kun kiggede på én meningsmåling, ville den statistiske usikkerhed være den samme for de to partier.

I takt med at der kommer flere meningsmålinger fra de forskellige analyseinstitutter vil det vægtede snit også kunne give bedre estimater på huseffekterne. De kommende vægtede snit vil derfor gradvist give mere præcise estimater på, hvor stor (eller lille) opbakningen er til Moderaterne.

Mandatfordeling

Når vi kigger på meningsmålinger er vi ofte ikke kun interesseret i hvor mange stemmer et parti vil få, men også hvor mange mandater i Folketinget opbakningen kan føre med sig. På baggrund af det vægtede gennemsnit viser siden nu, hvor mange mandater de forskellige partier står til at få.

Jeg bruger seatdist pakken i R til at estimere antallet af mandater, de forskellige partier vil få (jeg har tidligere givet en introduktion til pakken her). Det er en relativt simpel kalkulation, der ikke tager den statistiske usikkerhed i det vægtede gennemsnit i betragtning. Hvis et parti eksempelvis får 2,1% i det vægtede snit, vil det som minimum få flere mandater, hvor et parti der får 1,9% i det vægtede snit, vil få nul mandater.

Forsvarsforbeholdet

Den 1. juni skal danskerne stemme om forsvarsforbeholdet. Jeg har lavet en side der viser, hvad de forskellige meningsmålinger om forsvarsforbeholdet viser.

Det skal her nævnes, at jeg ikke inkluderer meningsmålinger foretaget før udskrivelsen af folkeafstemningen (se eksempelvis denne måling).

Det gode ved folkeafstemningen er, at vi har en slutdato på, hvornår folkeafstemningen finder sted. Derfor har jeg også justeret x-aksen således, at vi kan se, hvor lang tid der er tilbage før folkeafstemningen. Dette gør det lettere også at forstå begrænsningerne ved de meningsmålinger, vi ser nu her. Meget kan ske mellem nu og valgdagen.

Der er mange interessante datapunkter, der ikke bliver vist i de figurer, jeg har lavet med opbakningen til en afskaffelse af forsvarsforbeholdet. For eksempel kan jeg se i Wilkes meningsmåling for Jyllands-Posten, at der er store forskelle på tværs af partiernes vælgere i andelen ved “Ved ikke” svar. Ikke overraskende er Dansk Folkeparti og Nye Borgerliges vælgere i overvejende grad klar til at bevare forsvarsforbeholdet, og kun omkring 10 procent af deres vælgere svarer “Ved ikke”. Omvendt kan vi se hos et parti som Enhedslisten, der også er imod en afskaffelse af forsvarsforbeholdet, at hen imod 40% af deres vælgere er i tvivl.