Erik Gahner Larsen

Hvorfor skal meningsmålinger være så præcise?

Journalister, kommentatorer og andre, der skal formidle og fortolke meningsmålinger, har det desværre med at ignorere eller fejlfortolke den statistiske usikkerhed.

Man kan som bekendt ikke tale om meningsmålinger uden også at tale om usikkerhed. Når vi ikke måler alle meninger, vi ønsker at udtale os om, er der selvsagt brug for at kvantificere den grad af sikkerhed, vi ønsker at udtale os med. Her er standardpraksis, at medierne – der formidler disse meningsmålinger – udregner den statistiske usikkerhed med 95% konfidensintervaller og rapporterer den maksimale statistiske usikkerhed i målingen for de respektive partier.

Hvorfor er den statistiske usikkerhed så vigtig? Fordi den pointerer den væsentlige kendsgerning, at vi ikke arbejder med præcise tal. Vi arbejder med estimater. Personligt er jeg mindre opmærksom på, om den statistiske usikkerhed er 2,5 procentpoint eller 3 procentpoint for et parti. Det vigtigste er, at man erkender, at der er en statistisk usikkerhed, og dermed også en sandsynlighed for, at man tager fejl.

Det betyder også, at i det sekund, at der er en forskel mellem to partier, der ligger uden for den statistiske usikkerhed, kan vi stadig ikke være 100% sikker på, at der er en forskel, blot at sandsynligheden for, at der er en forskel, er blevet større.

Udfordringen er, at usikkerheden er kalkuleret ud fra den antagelse, at meningsmålingen bygger på en repræsentativ stikprøve fra en population, eller om ikke andet kan antages at være repræsentativ. Vi tager dermed ikke hensyn til systematiske skævheder og andet, der kan give forkerte estimater.

Dette blev der især sat fokus på efter præsidentvalget i 2016, hvor de fleste modeller, der tog udgangspunkt i forskellige meningsmålinger, forudsagde, at Hillary Clinton ville blive USAs næste præsident. Kigger man på dækningen dengang, var der dog også allerede før valget fokus på, at meningsmålingerne ikke er præcise estimater.

Pew Research Center gjorde meget ud af at formidle den statistiske usikkerhed (se eksempelvis her). New York Times kunne vise, at det samme datamateriale kunne føre til forskellige estimater for, hvor stor opbakningen var til henholdsvis Hillary Clinton og Donald Trump. Josh Katz viste på bloggen TheUpshot, at der var stor forskel på modellerne (hvor der var en meget høj grad af usikkerhed).

Ligeledes blev det vist, hvordan få respondenter, alt efter hvordan der vægtes i meningsmålingerne, kan have en afgørende betydning for, hvad målinger viser. Det blev ligeledes argumenteret for, at den statistiske usikkerhed ofte skulle ses som ±7% i stedet for ±3% (altså en langt større usikkerhed end vi normalt arbejder med).

Det korte af det lange er, at der er ved at komme ne større erkendelse af, at vi skal tage meningsmålingernes styrker og udfordringer i betragtning, når vi formidler disse.

I årtier har nyhedsartikler med meningsmålinger fulgt den samme skabelon. Der informeres i de fleste tilfælde om meningsmålingen, herunder hvad den kommer frem til. Hvad der ellers bliver nævnt varierer betydeligt. I nogle artikler informeres der om, hvem der har betalt meningsmålingen, hvilke spørgsmål der er stillet, hvor stor den statistiske usikkerhed er og så videre.

Nu er der som sagt en øget erkendelse af, at meningsmålingerne har en større værdi end blot isolerede nyhedsartikler, der formidler de respektive målinger. Én enkelt meningsmåling bør mødes med en vis skepsis og ønsket om, at se om lignende tendenser opstå i andre og flere meningsmålinger. Dette har ført til et par journalistiske initiativer, blandt andet meningsmålingeraggregater som de nævneværdige Risbjerg-snittet hos Altinget og Berlingske Barometer.

Udfordringen med meningsmålingeraggregater er, at de kan reducere relevante forskelle mellem analyseinstitutter og kan give en lavere statistisk usikkerhed, der kun er berettiget hvis bestemte antagelser overholdes.

Det er af denne grund at jeg på Politologi.dk sætter fokus på at vise alle meningsmålinger, så det står klart, at meningsmålingerne ikke altid viser det samme. Hvis man eksempelvis kigger på Nye Borgerlige, kan man se, hvordan uenigheden mellem analyseinstitutterne ikke blot skyldes tilfældig støj.

Hvad jeg håber at se mere af i fremtiden er et øget fokus på manglende præcision i mediernes dækning. Der har været et alt for stort fokus på at formidle partiernes opbakning ned til mindste decimal, som udelukkende bidrager til at give en opfattelse af, at meningsmålingerne kan sige noget med større sikkerhed, end de reelt kan.

Et af de eksempler man kunne applicere i dækningen af meningsmålinger, finder man hos Der Spiegel, der i en artikel formidlede antallet af influenzalignende lægebesøg. Dette eksempel er interessant, da der er en statistisk usikkerhed, der også skal visualiseres.

Som det kan ses i ovenstående figur fluktuerer estimatet inden for den statistiske usikkerhed, så det er klart for læseren, at der ikke er tale om et præcist estimat.

Det er relativt nemt at lave lignende visualiseringer, når det kommer til meningsmålinger. I nedenstående eksempel tog jeg en meningsmåling fra Voxmeter, og lod den statistiske usikkerhed være dynamisk med henholdsvis 90%, 95% og 99% konfidensintervaller.

I figuren forsøger jeg ligeledes at tage fokus fra det specifikke punktestimat. Det er selvfølgelig muligt at aflæse dette, men det er gemt væk i den statistiske usikkerhed, hvorfor man forhåbentlig fokuserer mere på den dynamiske usikkerhed end ét statisk tal.

Meningsmålinger er i sagens natur ikke præcise. De er kvalificerede estimater, der skal formidles med omtanke og med fokus på den usikkerhed, de kommer med. Der er heldigvis forskellige måder denne usikkerhed kan formidles på, og det kunne være interessant at se de danske medier prøve kræfter med at sætte mere fokus på denne usikkerhed. Især i relation til det snart kommende folketingsvalg.

Hvor mange vil stemme på Nye Borgerlige? #6

Når Nye Borgerlige taler, er medierne lutter øren. Det tiltrækker som regel mere bevågenhed, end hvad man måtte forvente sig af et parti uden parlamentarisk indflydelse (endsige parlamentarisk repræsentation).

Mediernes forelskelse i partiet er dog ikke ny. Tværtimod kan man argumentere for, at Nye Borgerlige er et medieskabt fænomen. Hvis man kigger tilbage på Nye Borgerliges relativt korte historie, synes mediernes interesse for partiet at være en vigtig konstant.

Dette kunne man således se allerede i 2016, da partiet blev annonceret. Medierne stod i kø for at dække alle tænkelige vinkler af dette parti, og sågar gøre hvad man kunne for at sandsynliggøre partiets fortsatte eksistensberettigelse.

Megafon foretog eksempelvis en meningsmåling der, stik mod alle faglige principper, konkluderede, at partiet kunne få op mod 10 procent af stemmerne ved et folketingsvalg. Denne meningsmåling var metodisk forkert og sagde intet om den reelle opbakning til Nye Borgerlige. Det eneste vi lærte noget om var Megafons metodiske standarder, eller snarere fraværet af samme, og medierens kærlighed til partiet.

Til trods for at langt de fleste meningsmålinger i begyndelsen af partiets eksistens viste, at der ikke var overbevisende evidens for, at partiet ville blive valgt ind efter næste folketingsvalg, fortsatte medierne med at give partiet rig omtalte.

Når der en sjælden gang kom en meningsmåling, der viste noget ekstremt, eksempelvis at partiet ville få i nærheden af 5 procent af stemmerne, gik medierne i selvsving og fokuserede på dette. For andre indlæg omkring dette, se eksempelvis her, her, her og her.

Det synes derfor fair at konkludere, at medierne har gjort deres for, at partiet har fået momentum og nu står betydeligt bedre i forhold til, at blive repræsenteret efter næste folketingsvalg.

Hertil skal det selvfølges indvendes, at det er svært at sige, hvad der kommer først: mediernes opmærksomhed eller partiets succes? Med andre ord: Hønen eller ægget? Heldigvis er der evidens fra udlandet, der kan sandsynliggøre, hvad der kommer først, når populistiske partier får succes.

I et studie af det højrepopulistiske parti UKIP i England, analyserede forskere data på mediernes dækning og partiets opbakning i meningsmålingerne. De statistiske analyser viste, at når partiet mistede opbakning i befolkningen, var medierne med til at få dem tilbage igen. Lige så vigtigt fandt de frem til, at det modsatte ikke var tilfældet, altså at medierne blot formidlede partiets succes. Medierne var med andre ord med til at skabe partiets succes.

Vi har ingen grund til at tro, at det modsatte skulle være tilfældet i en dansk sammenhæng for Nye Borgerlige. Der er ganske enkelt intet nyt eller særegent i, at medierne giver ekstra opmærksomhed til populistiske politikere. I forlængelse af det amerikanske præsidentvalg i 2016 blev det estimeret, at Donald Trump, der til sammenligning med andre politikere brugte begrænsede ressourcer på sin kampagne, fik gratis medieeksponering svarende til 5 milliarder dollars. Dette var mere end Hillary Clinton, Bernie Sanders, Ted Cruz, Paul Ryan og Marco Rubio – tilsammen.

Hvor står Nye Borgerlige i dag? Kigger man på meningsmålingerne, er de forskellige analyseinstitutter ikke helt enige. YouGov placerer partiet på omkring 5 procent, altså et pænt stykke over spærregrænsen. Voxmeter, der foretager ugentlige meningsmålinger, har dem omkring spærregrænsen. Norstat, Greens, Epinion, Megafon og Gallup placerer alle partiet mellem de 2 til 5 procent af stemmerne.

Det kan derfor tyde på, at Nye Borgerlige står til at blive valgt ind ved næste valg. En del af dette skyldes selvfølgelig, at partiet har en politisk agenda, der er et marked for blandt en del af vælgerne. Det skyldes dog med al sandsynlighed især også mediernes forelskelse i partiet.

Alt dette betyder ikke, at medierne skal ignorere Nye Borgerlige. Partiet er symptomatisk for lignende tendenser på tværs af den vestlige verden. Den interessante diskussion er, om medierne skal bidrage til en så omfattende dækning, hvor partiets succes ved næste folketingsvalg bliver mediernes selvopfyldende profeti.

Hvor mange vil stemme på Klaus Riskær Pedersen? #2

Forleden kritiserede jeg en meningsmåling foretaget af YouGov for B.T., der viste, at 1,9% af danskerne kunne overveje at stemme på det nye parti, Klaus Riskær Pedersen. Specifikt konkluderede jeg: “Det eneste chokerende ved denne måling er, hvor elendig den er ud fra et fagligt perspektiv.”

Dårlige målinger hænger ofte sammen med dårlig journalistik, og dagen efter kunne man finde denne forsidehistorie på lørdagsudgaven af B.T.:

Dette var en klar fejl af B.T., da meningsmålingen – til trods for dens ringe metodiske kvalitet – som bekendt ikke sendte partiet i Folketinget. Chefredaktøren hos B.T., Michael Dyrby, var da også ude og erkende denne fejl (se også dækningen hos TjekDet).

Siden da har vi fået en række af meningsmålinger, der giver os mulighed for at belyse, om Klaus Riskær Pedersen står til at blive valgt ind. Konkret har vi 16 målinger fordelt på syv analyseinstitutter. Alle målinger er foretaget efter partiet er blevet opstillingsberettiget.

Figur 1 viser opbakningen til Klaus Riskær Pedersen i de respektive meningsmålinger sammen med den statistiske usikkerhed (95% konfidensintervaller) for hvert estimat. Der er ingen meningsmåling, der har givet partiet 2 (eller flere) procentpoint af stemmerne. Med andre ord: ingen chokerende målinger, der sender partiet i Folketinget.

Figur 1: Opbakningen til Klaus Riskær Pedersen i meningsmålingerne

Tager man den statistiske usikkerhed i betragtning, kunne man ikke på baggrund af alle målingerne konkludere, at partiet lå under spærregrænsen (det var med andre ord too close to call). For langt de fleste meningsmålinger, og især alle nyere meningsmålinger, er der dog intet tegn på, at partiet bliver valgt ind.

Dette kan hænge sammen med, at partiet ikke har haft så meget offentlig interesse siden partiet blev opstillingsberettiget. Kigger man eksempelvis på Google Trends kan man se, at den relative offentlige interesse var betydeligt større da partiet blev erklæret opstillingsberettiget, og har ikke været på det niveau siden. Dette er vist i Figur 2.

Figur 2: Interessen for Klaus Riskær Pedersen over tid

Der har været flere historier om partiet/personen siden partiet blev opstillingsberettiget, herunder den negative om hvordan et hul i valgloven blev udnyttet, men ikke noget positivt, der har været nok til at sikre en solid vælgeropbakning.

Dette er ikke det samme som at sige, at partiet ikke har en chance ved det kommende folketingsvalg. Tværtimod. Det hele beror på, hvor meget taletid medierne giver Klaus Riskær Pedersen såvel som hvordan partiet klarer sig i partilederdebatter m.v. For nu er der dog intet der tyder på, at partiet står til at blive valgt ind.

Boganmeldelse: Oprør fra udkanten

Det er valgår. Det næste folketingsvalg, der skal holdes senest den 17. juni 2019, er så småt på trapperne (for en guide til, hvad du skal vide om det næste folketingsvalg, se her). Som optakt til dette giver det god mening at kaste sig over den litteratur, der blev skrevet om det seneste folketingsvalg.

Folketingsvalget i 2015 markerede et skifte fra en rød til en blå regering. Mange, både venstre- og højreorienterede vælgere, ville argumentere for, at den røde regering havde været mere blå end rød (og dermed gav betegnelsen ‘Blå Bjarne’ en helt ny betydning).

Der er skrevet mangt og meget omkring, hvad der helt præcist skete før, under og efter Helle Thorning-Schmidts regeringstid og de mange regeringsrokader, men faktum er, at hun ikke formåede at holde regeringsmagten til trods for en fremgang til Socialdemokraterne ved valget i 2015 (en fin guilty pleasure bog om perioden er Henrik Qvortrups Tre år ni måneder tre dage).

Det parti der i overvejende grad kunne fejre valget, var Dansk Folkeparti. Partiet oplevede en fremgang på hele 8,8 procentpoint og var dermed ikke alene det parti, der sikrede et blåt flertal, men også det største borgerlige parti.

Figur 1 viser partiernes størrelsesforhold efter 2015-valget i mandater. Dansk Folkeparti med hele 37 mandater ligger solidt ude til højre og mestrer det store flertal i den blå lejr. Liberal Alliance klarede sig ganske fint, og de Konservative oplevede endnu et dårligt valg. På venstrefløjen var det interessante, foruden Socialdemokraternes fremgang, at et nyt parti, Alternativet, blev valgt ind med 9 mandater.

Figur 1: Fordelingen af partiernes mandater i Folketinget, 2015

Bogen Oprør fra udkanten beskæftiger sig med netop det folketingsvalg, der resulterede i den pågældende parlamentariske fordeling. Som tilfældet oftest er med disse bøger, tager den sit afsæt i den dertilhørende danske valgundersøgelse og er bygget tematisk op i de respektive kapitler.

Kapitel 1 placerer folketingsvalget i 2015 i en historisk kontekst. Vi får information omkring valgkampagnen, resultatet, forskelle og ligheder med tidligere valg, vælgernes og mediernes dagsorden etc. Dette skal traditionen tro klæde læseren på til de efterfølgende kapitler.

En af de interessante pointer i dette kapitel er, at der ikke var tale om et jordskredsvalg. Dette af to grunde. For det første fordi vandringerne primært foregik inden for de politiske blokke. For det andet fordi der kun var ét nyt parti (Alternativet), der meldte sin ankomst. Et jordskredsvalg a la 1973 var der derfor ikke tale om. Dette er interessant da den anden bog om folketingsvalget i 2015, Fra krisevalg til jordskredsvalg, netop omtalte valget som et jordskredsvalg (for min anmeldelse af denne bog, se Tidsskriftet Politik 19(4):113-117).

En anden pointe er relateret til bogens titel, Oprør fra udkanten, og hvilke flertydigheder men relaterede fænomener, titlen refererer til. Der var således tale om et oprør fra en geografisk, politisk og social udkant, hvor geografi, uddannelse og indkomst påvirkede vælgernes adfærd, herunder især opbakningen til Dansk Folkeparti. Det var dette oprør fra udkanten, der fik Dansk Folkeparti til at placere sig så solidt på den parlamentariske udkant (på højrefløjen).

Der er således flere interessante pointer allerede fra bogens begyndelse. Det er dog også her, at bogen forsøger at binde de forskellige kapitler sammen. Dette gøres uden de store vanskeligheder med nogle kapitler, men der er en række kapitler, der ikke passer ind i den ramme, bogen forsøger at skabe.

Som overordnet teoretisk ramme anvendes kausalitetstragten. Denne var også i brug i den forudgående bog omkring 2011-valget, Krisevalg – Økonomien og folketingsvalget 2011 (for min anmeldelse af denne og min kritik af kausalitetstragten, se Tidsskriftet Politik 16(3):57-59).

Problemet er som bekendt at kausalitetstragten intet har med kausalitet at gøre, hvorfor man da heller ikke ser denne betegnelse brugt i fagfællebedømte artikler i dag. Og de indsigter den beror på i bogen, problematiseres i en lang række af studier omkring politisk motiveret tænkning. Det skrives således også i bogen: “Kausalitetstragt-strukturen er altså flere steder suppleret med nyere, mere psykologisk og/eller emnebaserede tilgange til studiet af partivalg” (side 39). Der er dog ikke tale om et supplement, men tale om perspektiver der direkte modsiger kausalitetstragtstrukturen.

Bogen indeholder dermed kapitler, der enten beror fuldt og fast på kausalitetstragten eller arbejder med antagelser, der modarbejder denne. Det er ikke nødvendigvis et problem for mange af de indsigter, bogen ubestrideligt har at byde på, men summen af de respektive indsigter går desværre ikke op i en højere enhed.

Kapitel 2 går i dybden med, hvilken rolle sociodemografiske forhold spillede for vælgerens adfærd. Her kigges på the usual suspects såsom køn, alder, uddannelse, klassetilhørsforhold (stilling) og indkomst. Der kigges først på udviklingen over tid, hvorefter der laves nogle regressionsanalyser. Det er så klassisk statskundskab, som det kan blive.

Dette fører os videre til kapitel 3, hvor vi går i dybden med Udkantsdanmark og mere specifikt geografiens betydning for vælgerens adfærd. Geografiens betydning er dog kun i begrænset omfang belyst efter at have læst kapitlet, og der er sandsynligvis i højere grad tale om demografiske forhold. Især i forhold til opbakningen til Dansk Folkeparti.

Der præsenteres i dette kapitel en lang række danmarkskort med de forskellige partiers tilslutning, men kortene giver ikke mulighed for at sammenligne geografiens betydning for de forskellige partier. Med andre ord er det uklart, hvor meget der rent faktisk kan forklares af sammensætningen af befolkningen i de respektive områder.

En masse kort med de forskellige partiers tilslutning giver således ikke mulighed for at sammenligne geografiens betydning for de forskellige partier (slet ikke givet det dynamiske farvevalg i bogen). Det kan i bedste fald vise at der er forskelle i, hvor forskellige vælgere bor, men det er der ikke meget nyt i (for interessant ny forskning i forhold til disse spørgsmål, se Maxwell 2019).

I kapitel 4 fokuseres der på social tryghed og risikovillighed i forhold til vælgerens adfærd. Her undersøges en social og en psykologisk risikoopfattelse. Der formidles flere interessante pointer der sandsynliggør, at risici er et vigtigt teoretisk begreb for at forstå vælgerens adfærd.

Det er dog også her svaghederne i kapitlet opstår, da det er teoretisk uklart, hvad der helt præcist skal forstås med en psykologisk risikoopfattelse. Det defineres som at “holde sig til status quo og det sikre” (s. 98), men hvad hvis status quo ikke opfattes som det sikre? For mange (nostalgiske) vælgere er status quo det usikre – og det kunne være interessant at høre mere om, hvad der helt præcist tales om, når der tales om risikoopfattelse.

Social usikkerhed forstås primært i relation til arbejdsmarkedet og måles med subjektive mål relateret til uddannelse, indkomst m.v. Dette giver fin mening, men gør det også uklart hvor stort et konceptuelt overlap der er med de andre kapitler, der bruger selvsamme mål uden at relatere det til social tryghed.

Kapitel 5 belyser vælgerens motivation til at undgå infektionskilder. Min læsning er, at det ikke har den store relevans for at forstå 2015-valget – og der er ingen indikation på, at det er relevant for at forstå fremtidige valg.

Kapitel 6 byder på flere interessante metodiske pointer i forhold til at undersøge valgdeltagelse. Udfordringen er, at der er flere vælgere, der i Valgundersøgelsen rapporterer, at de har stemt, end der rent faktisk har stemt. Kapitlet finder evidens for både misrapportering (ikke-vælgere udgiver sig for at være vælgere) og selvselektion (ikke-vælgere er mindre tilbøjelige til at deltage i en undersøgelse omhandlende valg). Denne forskning er ligeledes formidlet i tidsskriftet Political Analysis.

Kapitel 7 og 8 kigger på henholdsvis politikernes (lave) troværdighed og vælgernes tillid til politikerne. Begge kapitler fokuserer på Lars Løkke Rasmussens lave troværdighed og mener, at denne har været udslagsgivende for Venstres opbakning og vælgernes generelle tillid til politikerne. Disse kapitler er med andre ord tæt forbundne.

Kapitel 9 og 10 kigger på henholdsvis emneejerskab og issue voting. Disse kapitler supplerer hinanden godt og er blandt de bedst formidlede i bogen (ingen taltunge tabeller men blot simple figurer). Her vises det blandt andet hvordan både røde og blå vælgere er enige om, at Socialdemokratiet “ejer” miljøemnet, samt hvordan vælgerne opfatter indvandringsspørgsmålet. Noget der helt sikkert vil være fokus på under den kommende valgkamp.

De efterfølgende kapitler går i dybden med specifikke emner, herunder betydningen af økonomien (kapitel 11), velfærdsstaten (kapitel 12) og indvandring (kapitel 13). Disse kapitler er interessante hver især, men det er ikke udelukkende en ros. Det gør desværre også, at det er svært at koble indsigterne sammen og se den røde tråd på tværs af de respektive kapitlers indsigter.

Kapitel 14 introducerer begrebet politisk motiveret tænkning og er dermed en kritik af de perspektiver og antagelser, flere af bogens respektive kapitler implicit og eksplicit bygger på. Som det konkluderes “udfordrer resultaterne de gængse teoriers opfattelse af vælgeradfærd” (side 299). Konkret vises det med et eksperiment, at vælgerne tager udgangspunkt i deres partitilknytning, når de vurderer økonomien – og ikke blot vurderer økonomien og deraf udleder, hvem de vil stemme på.

Hvor kapitlerne til nu primært har fokuseret på vælgerne, kigger kapitel 15 på valgkampagner og især folketingskandidaternes kampagner. Her undersøges det blandt andet om forskellige kampagneredskaber korrelerer med andelen af personlige stemmer. Dette er overordnet fint, men jeg ville gerne have set et mindre fokus på at tolke disse korrelationer som kausale “effekter”.

Kapitel 16 går i dybden med partiskiftere, altså de vælgere, der mellem 2011- og 2015-valget skiftede fra et parti til et andet. Det er dette kapitel der, til trods for at vise, at mange vælgere skiftede parti, også viser, at langt de fleste forandringer skete internt i de politiske blokke.

Kapitel 17 og kapitel 18 fokuserer på medierne. Først, kigges der på, hvordan aviserne overordnet betragtet dækkede valgkampen, hvorefter der fokuseres på meningsmålingerne i valgkampen. Sidstnævnte – altså kapitel 18 – er af størst interessse og går i dybden med, hvorfor meningsmålingerne havde svært ved at ramme Dansk Folkeparti rigtigt ved valget. Det gode ved dette kapitel er, at der diskuteres potentielle fejl og løsninger.

Det sidste kapitel (kapitel 19), formidler “en samlet vælgeradfærdsmodel” med udgangspunkt i kausalitetstragten. Dette virker mest som genbrug for førnævnte bog om 2011-valget og kan nemt skippes.

Tilbage står man med en bog, der har langt flere styrker end svagheder. De fleste kapitler fungerer godt individuelt, men summen af dem efterlader en følelse af, at der ikke er én sammenhængende vælgeradfærdmodel. Dette er efter min vurdering symptomatisk for kvaliteten af forskningen i disse år og dermed ikke et problem for indholdet. Det ville dog have klædt bogen ikke at give illusionen af ét sammenhængende narrativ, med mindre indholdet havde lagt op til dette.

Efter at have læst bogen er man klædt godt på endnu et valg, der er lige om hjørnet. De fleste meningsmålinger tyder på, at de blå partier går et hårdt valg i møde. Venstre er langt fra det niveau, de de burde ligge på. Dansk Folkeparti har mistet en stor del af deres vælgere til Socialdemokraterne og udfordres af Nye Borgerlige, der er potentielt stemmespild til blå blok.

Det interessante spørgsmål er selvfølgelig, hvor mange vælgere især Venstre kan flytte over midten i en valgkamp (se her og her). Det får vi svar på inden længe, og der vil med sikkerhed være spørgsmål nok at besvare for endnu en valgbog.

Potpourri: Statistics #53

Hvor mange vil stemme på Klaus Riskær Pedersen?

Hos B.T. kan man læse om en chok-måling, der vil sætte et tal på, hvor mange der vil stemme på Klaus Riskær Pedersens parti af samme navn: “Hans nydannede parti, der bærer hans navn, står nemlig til 1,9 procent af stemmerne.”

Det eneste chokerende ved denne måling er, hvor elendig den er ud fra et fagligt perspektiv. YouGov, der har foretaget målingen, gør i hvert fald hvad de kan for at vise, at man ikke bør tage dem seriøst som analyseinstitut. Problemet med målingen er, at der ikke er tale om en meningsmåling, hvor vælgerne er blevet spurgt om, hvilket parti de ville stemme på, hvis der var valg i morgen.

I stedet er vælgerne blevet givet følgende spørgsmål: “Hvor tilbøjelig vil du være til at stemme på ‘Partiet Klaus Riskær Pedersen’ ved det kommende folketingsvalg, som skal afholdes senest den 17. juni 2019?”

Dette fører til, at flere vil give udtryk for, at de vil stemme på partiet, end hvis der var tale om en normal meningsmåling. For at illustrere det problematiske, kan vi kigge på tidligere tilfælde. I 2016 viste en Voxmeter-måling, at 10,8 procent af danskerne ville stemme på Nye Borgerlige. Dette var lodret forkert og udelukkende tilfældet grundet den samme procedure som anvendes i aktuelle YouGov-måling.

Senere i 2016 kom der en lignende måling fra Gallup omhandlende opbakningen til Danskernes Parti. Denne måling viste en opbakning på 3,4 procent til partiet, der for længst er glemt. Ligeledes et tal der ikke siger noget som helst om, hvor mange der ville stemme på partiet ved et folketingsvalg.

Denne slags meningsmålinger er ubrugelige for alle andre end journalister, der ikke forstår metode, og så selvfølgelig de nævnte partier, der har brug for at vise, at de har opbakning i befolkningen. Det eneste interessante ved denne måling er, at end ikke med så misvisende og fejlagtig en måling er der evidens for, at Klaus Riskær Pedersen står til at blive valgt ind.

Hvordan vil danskerne stemme til Europa-Parlamentsvalget?

I en ny rapport fra Europa-Parlamentet foretaget af Kantar Public, gives der tal på, hvordan partierne vil klare sig ved det kommende Europa-Parlamentsvalg.

Der er dog tale om en rapport, der har betydelige svagheder. Disse svagheder gør, at man bør være varsom med at tolke for meget ud af disse resultater. Dette udtaler jeg mig om i en artikel hos Mandag Morgens TjekDet. Artiklen kan læses her.

Potpourri: Statistics #52

How to improve your figures #1: Don’t use the y-axis to mislead

There are good reasons to think carefully about the y-axis when you design figures, including considerations on whether to start your y-axis at zero or not. In this post, I provide a simple piece of advice: when presenting bar charts on a linear scale, start at 0. Not 0.38. Not 0.31. Not 0.04. 0.

The figure below, from Hanel et al. (2018), depicts the same data in three panels. It shows how the same data can be presented in different ways with implications for how we perceive differences between groups.

In the first panel, we see the distributions of the two groups. In the second panel, we see that the y-axis starts at 4.6. In that figure, it looks like the value for Poland (the red bar) is three times greater than the value for the UK (the blue bar). In the third panel, relative to the second panel, we see a much better presentation of the two groups with a y-axis starting at zero.

Despite the fact that bar charts with arbitrary and non-zero starting y-axes are problematic, I see it again and again in scientific publications. Take for example this new article in the American Political Science Review, where the bar charts use the y-axis to mislead. Specifically, they leave the impression of a greater difference between the two groups than is supported by the data:

For another example, take this new article in Political Communication where the bar chart conveniently starts at 4.00% to give the impression of a large difference between the groups. (On a sidenote, I can’t believe how unlucky the authors were. The only statistical finding in the article is the finding that wasn’t preregistered.)

Alas, journals and books are filled with examples of bar charts that use the y-axis to mislead. The general issue is that these figures do not comply to the principle of proportional ink: “The sizes of shaded areas in a visualization need to be proportional to the data values they represent.”

This is not to say that y-axes should always start at zero. On the contrary, there are many cases where figures should definitely not start at zero (see this article from Quartz and this video from Vox for more information). However, when creating a bar plot, the best way to improve your figure is to comply to the principle of proportional ink. Start at 0.

Do men face more discrimination?

An article in the Daily Mail presents the argument that men face more discrimination than women. Similarly, RT writes: “Contrary to everything you’ve ever been told, in most developed countries men are actually more disadvantaged than women, according to new research published in one of the world’s leading scientific journals.” And Yahoo Finance writes “that men actually face more discrimination than women”. The story also made it all the way to Fox News.

The coverage builds upon a new article published in PLOS ONE, “A simplified approach to measuring national gender inequality“. The article begins with a critique of existing indices and especially the popular The Global Gender Gap Index (GGGI, an index I also criticised in a post last year). The authors of the article focus in particular on one aspect of the GGGI, namely that no country (by definition) can be more favourable towards women than to men. As they formulate their critique: “there is no defensible rationale for truncating scores on an ‘equality’ measure when they disadvantage boys or men.”

Based on this, they develop a measure of national gender inequality tapping into three specific dimensions: 1) educational opportunities, 2) life expectancy and 3) life satisfaction. They call this the BIGI, the Basic Index of Gender Inequality. The objective of the index is to pay attention to measures where women perform as well as or better than men. It is, for example, a well-known fact that women tend to live longer than men.

In Figure 1 in the article, the authors present deviation from gender parity across the 134 countries in the sample (missing data is illustrated with a black colour):

What can we learn from this analysis? Here is the main finding of the article that is getting the most attention in the media coverage: “In 91 (68%) of the 131 countries, men were on average more disadvantaged than women, and in the other 43 (32%) countries, women were more disadvantaged than men. The international median of the BIGI is -0.017 (SD = 0.062), that is, nearly a two percent deviation from parity, favoring women.”

While I believe it is great to put emphasis on dimensions where men face problems to a greater extent than women, I do believe there are noteworthy limitations in the study that are lost in the coverage. These limitations are significant and when taken into account, there is no support for the conclusion that men are discriminated more than women.

First and most importantly, the selling point of the study – i.e. the simplified approach – is also the main limitation. The study focuses on a limited set of indicators, selected in favour of men (in other words, to show numbers where women are doing better than men in a lot of countries), that are not necessarily providing a representative picture of gender inequality in a comparative perspective. Accordingly, it is misleading to draw conclusions about whether men in general are more disadvantaged than women.

Second, and related, the study argues that the approach “avoids the difficulties of choosing and weighing indices that are relevant in some contexts but not others, and often may reflect life choices rather than restricted opportunities”. I would argue that simply getting rid of most indicators is not a suitable solution to the challenge of finding relevant indices. As an example, the authors mention that “the ratio of male to female national politicians is only relevant to the tiny proportion of people who choose a political career”. This is incorrect as several studies demonstrate the implications and relevance of having female politicians beyond the career trajectories of the respective politicians (e.g. Anzia and Berry 2011, Clayton et al. 2019, Gilardi 2015, Ladam et al. 2018, and Mendelberg et al. 2013).

Third, I would not make conclusions about the state of gender (in)equality in different countries based on the BIGI. Saudi Arabia, for example, is one of the countries with a relatively high level of overall average gender parity. Granted, I do not know a lot about gender equality and discrimination in Saudi Arabia, but I am reluctant about calling the country a national gender equality pioneer. While the authors provide some post hoc reflections on why Saudi Arabia takes up such a good place, I see no convincing case for taking these scores serious.

Fourth, even if we want to compare countries, we are unable to say whether there are any statistically significant differences between the countries. It can be difficult to compare the scores on the index in substantial terms, and we are unable to say whether any country is actually significantly more equal than any other country.

Fifth, and related, one of the measures used to create the index is the overall life satisfaction data from the Gallup World Poll. However, they do not take any measurement error or uncertainty into account in any of the estimates. Accordingly, while they argue that the life satisfaction score is culturally independent, I do believe additional work is needed before the index scores are useful for what the researchers use it for. Furthermore, the use of survey data significantly limits the data availability and quality. In brief, I am not convinced that the life satisfaction data is of an equal quality and equally representative in the 134 surveyed countries, and we are limited in the spatial and temporal coverage of the index.

Sixth, in connection to the media coverage described above, the study says nothing about discrimination at all. Even if we do not take any of the limitations outlined so far into account, we cannot say anything about actual discrimination. In other words, the news coverage of the study is extremely misleading.

Overall, while I appreciate the objective of providing a better measure of gender inequality in a comparative setting, I do believe that the limitations outlined above render the index useless for actual policy recommendations. As I told the Danish newspaper Weekendavisen the other day, it is important to look at gender inequalities across different countries, but I cannot see the usefulness of this particular index in its current form.