Potpourri: Statistik #33

Survey Experiments in Practice: #1, #2, #3, #4, #5
FiveThirtyEight’s data journalism workflow with R
Text Mining with R on Vikings episode scripts
A List of ggplot2 extensions
The viridis color palettes
Learn R online – A curated list of online courses on R
Stop Using Google Trends
DrawMyData
Everything is fucked: The syllabus

Analyse i Politiken: Hvornår får 16-årige lov til at stemme?

Har d.d. en analyse i Politiken sammen med mine kollegaer Klaus Levinsen og Ulrik Kjær. Analysen omhandler valgretsalderen og udsigterne til at den bliver sænket til 16 år. Mere specifikt fokuserer vi på danskernes holdninger til spørgsmålet. Overordnet er der ikke den store folkelige support for en sænkelse af valgretsalderen, men der er også store forskelle i, hvilke borgere der støtter en sænkelse.

Det er især højreorienterede vælgere, der er imod en sænkelse af valgretsalderen. Som vi skriver i analysen: “Der [er] betydelige forskelle i, hvilke danskere der er imod en sænkelse af valgretsalderen. Her er det især de højreorienterede vælgere, der er imod at inkludere de unge borgere. Disse ideologiske forskelle er interessante i en international sammenhæng, idet resultater fra engelske undersøgelser viser, at vælgernes holdninger til valgretsalderen ikke i samme omfang er et ideologisk spørgsmål. I figuren ses det, at sandsynligheden for, at en borger er modstander af en sænkelse af valgretsalderen, er over 50 procent for både venstre- og højreorienterede.”

Hvor mange vil stemme på Danskernes Parti?

Forleden var en af de store politiske nyheder, at 10,8 procent af danskerne ville stemme på partiet Nye Borgerlige, hvis de var at finde på stemmesedlen ved næste folketingsvalg. Meningsmålingen fik masser af omtale, men som beskrevet er der intet der taler for, at 10,8 procent af danskerne ville stemme på Nye Borgerlige.

I dag formidler Berlingske en lignende meningsmåling foretaget af Gallup, bare for Danskernes Parti. Tallet her er 3,4 procent, men er – ligesom i tolkningen af Ritzau-målingen med Nye Borgerlige – på ingen måde det samme som, at 3,4 procent af vælgerne vil sætte deres kryds ved Danskernes Parti. Det kan undre en, at nogle journalister også her vælger at formidle denne slags meningsmålinger. Især i kølvandet på den mærkværdige dækning af meningsmålingen med Nye Borgerlige.

Det komiske er, at Gallup i Berlingskes artikel selv er ude med relevante forbehold, som Camilla Kann Fjeldsøe, leder af den politiske afdeling hos Gallup, udtaler: “Når man kun bliver spurgt ind til et enkelt parti, og om man vil stemme på dem, er der typisk flere, der er positive over for at stemme ja, end hvis man fik valgmuligheden mellem en række partier”. Godt så.

Der er ikke tale om en interessant meningsmåling, end ikke en nyhedsværdig måling. Der er tale om et forsøg på at give et indtryk af, at mange vælgere vil stemme på Danskernes Parti. Der er bare intet belæg for, at dette skulle være tilfældet. Det eneste der sker her er, at nogle journalister hopper i med begge ben.

Vil danskerne arbejde mere? II

For snart fem år siden skrev jeg, at svaret på om danskerne giver udtryk for at ville arbejde mere, afhænger af, hvad man helt præcist spørger om. Baggrunden var to meningsmålinger foretaget i den samme periode men med vidt forskellige resultater. Den ene meningsmåling viste, at 62 procent af danskerne var klar til at arbejde mere. Den anden meningsmåling viste, at 7 procent af danskerne var klar til at arbejde mere.

Det pågældende indlæg kom jeg i tanke om, da jeg læste en nyhed hos Berlingske, der formidler en undersøgelse, der viser, at topskattelettelser vil få folk til at arbejde mere. Mere konkret skrives der: “Forhandlingerne om lettelser af topskatten bliver uden tvivl et af efterårets største politiske emner og kan ende med at blive helt afgørende for regeringens overlevelse. Og ifølge [en] ny undersøgelse vil det øge arbejdsudbuddet, hvis man sænkede topskatten.”

Der er ingen tvivl omkring, at skattelettelser vil blive et emne på den politiske dagsorden, og når emner bliver aktuelle, kommer der også et hav af rapporter og studier, der skal “nuancere” den offentlige debat. Det interessante i denne sammenhæng er, at det empiriske materiale i undersøgelsen er en meningsmåling af meget ringe kvalitet. Den beskrives i artiklen som følger: “Den nye undersøgelse er foretaget af analyse- og konsulentfirmaet Moos-Bjerre & Lange på eget initiativ. De har i en webbaseret spørgeskemaundersøgelse spurgt 1.243 tilfældigt udvalgte danskere, som enten er i beskæftigelse eller under uddannelse, om deres forhold til lettelser af topskatten og villighed til at arbejde mere. Et billede, der ofte er blevet brugt i denne sammenhæng, er, om topskattelettelser vil blive en gulerod for at tage mere arbejde, eller om det vil blive en hængekøje, hvormed arbejdsudbuddet ikke stiger. Af den nye analyse fremgår det, at den positive nettoeffekt på arbejdsudbuddet er på 14,4 pct. Altså er konklusionen i undersøgelsen klar: Gulerods-effekten er simpelthen større end hængekøje-effekten.”

Når man læser ovenstående, er der en række spørgsmål, der trænger sig på. For det første er det på ingen måde klart, hvem der har foretaget meningsmålingen. Det formidles, at det er konsulentfirmaet, men har de en webbaseret platform, hvorfra de kan spørge 1.243 tilfældigt udvalgte danskere? Og så her i sommerperioden, hvor det er vanskeligt at få fat i bestemte grupper? Og ikke alene repræsentative for danskerne, men de danskere der er relevante at spørge? Jeg vil være meget påpasselig med at kalde resultaterne her for repræsentative, især når konsulentfirmaet ikke har givet flere informationer herom (der heller ikke er at finde i deres rapport).

For det andet skal vi se på, hvem man har valgt at inkludere i meningsmålingen. Det interessante er her, at det ikke er i nærheden af 1.243 respondenter, man bruger svarene fra, men den gruppe af respondenter, der siger, at de har mulighed for at tage mere arbejde. Disse mennesker er blevet spurgt: “Har du mulighed for at tage overarbejde på din arbejdsplads og derved tjene lidt ekstra?”. Bemærk her, at det ikke er blevet spurgt om, hvorvidt man har mulighed for at arbejde mere eller mindre, men blandt andet om at arbejde mere og tjene lidt ekstra. Her gør konsulentfirmaet hvad de kan for at påvirke respondenternes svar (ved at få dem til at tænke på at tjene ekstra). Samlet set er gruppen af personer, der har mulighed for at arbejde mere på 624 personer. Er gruppen af de 624 personer stadig repræsentativ for den population af danskere, der kan tage mere arbejde? Jeg tvivler.

For det tredje er det ikke tilfældigt, hvilke grupper der svarer, at de kan tage mere arbejde. Ud af de 624 personer, der kan tage mere arbejde, er omkring 168 studerende (den gruppe af respondenter, hvor flest svarer ja til, at de kan tage mere arbejde). Jeg er ikke økonom, men jeg finder det relevant at diskutere, hvor meget man kan lære om de dynamiske effekter af en ændring i topskatten på arbejdsudbuddet ved at spørge personer, der endnu ikke er i nærheden af at betale topskat.

For det fjerde skrives der i artiklen hos Berlingske, at “den positive nettoeffekt på arbejdsudbuddet er på 14,4 pct.” Men hvad menes der med dette? Man får let det indtryk, at meningsmålingen viser, at det vil have positive samfundsøkonomiske konsekvenser at sænke topskatten. Tallet viser dog blot differensen mellem dem, der siger, at de vil arbejde mere og dem der vil arbejde mindre (og dette er endvidere ikke for topskatten). Udfordringen er, at det ikke er muligt at sige, om dem der vil arbejde mindre, er dem der betaler topskat, hvorved det hypotetisk set kan have negative effekter på arbejdsudbuddet.

Der er noget komisk ved meningsmålinger, der ikke alene ønsker at belyse, om danskerne vil arbejde mere, men om et bestemt tiltag vil have en kausal effekt på, om danskerne vil arbejde mere. Dette bliver ikke mindre komisk af, at man spørger en masse mennesker, der ikke vil blive ramt af disse tiltag. Som altid kan det undre en, at journalisten ikke er mere kritisk i forhold til den undersøgelse, man finder nyhedsværdig og vælger at formidle.

Derfor vil jeg også blot bruge den samme konklusion som for fem år siden, altså at meningsmålingen blot illustrerer, at bestemte grupper har “en klar interesse i at fremme bestemte synspunkter i den offentlige debat, og det kan meget nemt tænkes, at de har et ønske om at meningsmålingerne viser noget bestemt i dette tilfælde.”

Potpourri: Statistik #32

Advice for learning to code from scratch
Vectorization in R: Why?
Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations
The Simpsons as a Chart
Causal Empiricism in Quantitative Research (ungated)
Methods workshop: Automated Text Analysis with R
Spring du bare den næste meningsmåling over
Weekly Updates from the Entire R Community
Good Books for All Things Data
Ten Simple Rules for Effective Statistical Practice

Det postfaktuelle demokrati

I løbet af de seneste par dage har man kunne læse flere bidrag i medierne om, at vi nu lever i en postfaktuel tid. I dagens Politiken kan man således læse, at vi “lever i en postfaktuel verden, hvor hver side har sine egne argumenter og sine egne urokkelige fakta. Vi har ikke længere bare forskellige meninger. Vi har forskellige kendsgerninger.” I RÆSON kan man læse en kronik, der argumenterer for, at vi ser konturerne til et postfaktuelt demokrati. I Information kan man læse, i kølvandet på Brexit, at vi ser “postfaktuel politik i en nøddeskal: Friheden til at udtrykke sin egen mening er blevet afløst af friheden til at udvælge sine egne kendsgerninger.” Hos Altinget skriver Lisbeth Knudsen, ligeledes i kølvandet på Brexit, at vi ser “en politisk proces med forskellige tolkninger, løsninger og holdninger, [der] ser ud til at blive erstattet af et postfaktuelt demokrati.”

Der er en lang række af fællestræk ved ovennævnte indlæg. For det første er de fyldt med de samme banaliteter. Pointerne i disse bidrag er, som det meste andet stof i de danske medier, et ekko af hvad man kan læse i de internationale (især amerikanske) medier, hvorfor der også primært er henvisninger til de eksempler, man kan finde i de internationale medier, især Brexit og Trump. For det andet er der tale om anekdotisk evidens. Der gives nogle ekstreme eksempler på, at mange vælgere nu i højere grad kan være selektive i forhold til deres valg af informationskilder, på hvilken baggrund der drages generelle konklusioner. For det tredje henvises der til nogle af de samme forklaringer, herunder især nyhedsmediernes indhold, den teknologiske udvikling og de sociale medier. For det fjerde henvises der til, at dette er et nyt vilkår ved den demokratiske samtale.

Ovenstående forhold gør det nemt at finde et par kritiske indvendinger til påstanden om, at vi nu skulle leve i et postfaktuelt demokrati. Overordnet er der tale om en klassisk forfaldshistorie, altså det der med, at alt var bedre i gamle dage. Der er intet nyt i denne kritik, og den er ikke nødvendigvis mere aktuel i dag. Som Alexios Mantzarlis har pointeret, har vi angiveligt haft postfaktuelle tilstande i flere årtier. Det interessante er dog også den betydning, der ligger i begrebet postfaktuel. Termen postfaktuel indikerer i denne sammenhæng, at vi tidligere har været i et faktuelt demokrati, hvor alt var fryd og gammen og politik blev ført med udgangspunkt i fakta. Som Brendan Nyhan korrekt har bemærket: “I don’t think that time ever existed”.

I kronikken hos RÆSON tilføjes der desuden et par ekstra bemærkninger til, hvad der menes med et postfaktuelt demokrati: “Et demokrati er i en postfaktuel tilstand i det tilfælde, at sandhed, fakta og saglig konsekvensberegning erstattes af robuste narrativer, opportune politiske dagsordener og urealiserbare løfter, således at den demokratiske debat og mobilisering mister forbindelsen til realistiske politiske løsninger og ren vælgermaksimering bliver målet i sig selv.”

Her blandes forskellige fænomener sammen, men der er især to relevante forhold. For det første virker det søgt at betegne urealiserbare løfter fra politikerne som et nyt vilkår. I en parentes bemærket kan det sågar tilføjes, at det som regel altid vil være de politikere, der leverer de mest realistiske urealiserbare løfter, der bliver valgt. Det er med andre ord politikernes jobbeskrivelse. Ikke et nyt vilkår. For det andet reduceres det hele til ren motivspekulation, når politikernes ambitioner ligeledes reduceres til at være ren vælgermaksimering (altså at appellere til flest mulige vælgere). Det er jo bare et mindre fint ord for demokrati, desuagtet motiverne.

Det er muligt, at der kan være noget om de pointer, de forskellige indlæg rejser. Der er bare et ironisk, tilnærmelsesvist komisk, fravær af fakta, til at bakke de pågældende påstande op. Jeg kunne sagtens have skrevet et indlæg om, at vi nu lever i et faktabaseret demokrati, hvor der er mere fokus end nogensinde før på at lave faktatjek, bedrive evidensbaseret politik og korrigere misinformation, men det er ikke min pointe. Min pointe er den simple, at hvis man gerne vil foretage den demokratiske diagnosticering, at vi nu lever i en postfaktuel tidsalder, så tag lidt fakta med til at bakke det hele op. Dette vil sikre, at det eneste bevis for at vi lever i en postfaktuel tidsalder, ikke blot bliver selvsamme analyses anekdotiske karakter.

Meningsmålinger i R med pollsDK

En ny pakke til R, pollsDK, giver mulighed for let at hente danske meningsmålinger ind i R. Pakken er lavet af Mikkel Krogsholm og installeres og indlæses vha. følgende (forudsætter at man har devtools-pakken installeret):

devtools::install_github("56north/pollsDK")
library("pollsDK")

Pakken er nem at bruge og giver blandt andet mulighed for at hente de meningsmålinger, jeg har liggende på GitHub. Dette gør man med funktionen gahner(). I nedenstående gemmer vi disse data i objektet polls og viser de seneste seks observationer herfra.

polls <- gahner()
tail(polls)
   id pollingfirm year month day party_a party_b party_c party_f party_i party_k
962 962  Voxmeter 2016   5 29  25.4   5.0   3.1   4.5   7.7   0.6
963 963   Greens 2016   6  2  25.7   5.4   3.2   5.1   6.5   0.7
964 964  Voxmeter 2016   6  5  25.8   4.9   2.9   4.6   7.4   0.8
965 965   Gallup 2016   6  9  25.1   4.6   3.5   4.6   7.3   0.7
966 966  Voxmeter 2016   6 12  25.4   4.3   2.9   4.0   7.9   0.7
967 967  Voxmeter 2016   6 18  25.9   4.9   2.6   4.1   8.7   0.7
  party_o party_v party_oe party_aa  n                    source
962  19.7  17.9   8.5   7.1 1020 http://voxmeter.dk/index.php/meningsmalinger/
963  19.7  16.6   9.0   7.8 1248      http://www.politiko.dk/barometeret
964  19.6  17.3   8.0   8.4 1039 http://voxmeter.dk/index.php/meningsmalinger/
965  19.8  18.9   8.2   6.9 1570      http://www.politiko.dk/barometeret
966  20.9  18.1   8.3   7.4 1032 http://voxmeter.dk/index.php/meningsmalinger/
967  20.7  17.5   7.8   6.9 1050 http://voxmeter.dk/index.php/meningsmalinger/

Disse data kan eksempelvis bruges til at visualisere partiernes vælgeropbakning over tid. I nedenstående eksempel er det vist, hvordan Socialdemokraterne har ligget i meningsmålinger fra 2010 til i dag (forudsætter at man har ggplot2-pakken installeret).

library("ggplot2")

polls$date <- format(as.Date(c(paste(polls$year, 
                   polls$month, 
                   polls$day, 
                   sep="-")), by = "days"))

ggplot(polls, aes(x=as.Date(date), y=party_a )) + 
 geom_point(col="red", alpha=.1) +
 geom_smooth(col="red", se=F, alpha=.5, size=1.2, span=.65) +
 theme_minimal() +
 ylab("Opbakning (%)") + 
 xlab("")

Hvor mange vil stemme på Nye Borgerlige?

I en ny meningsmåling foretaget af Voxmeter for Ritzau, står et parti med navn Nye Borgerlige til at få 10,8 procent af stemmerne. Nyheden har fundet vej til blandt andet Information, Børsen, Jyllands-Posten, BT og Berlingske.

Der er tale om en relativt normal meningsmåling. Lige godt 1000 respondenter (1065, for at være helt præcis) har svaret på en række politiske spørgsmål, men så går det også galt for Voxmeter. I en normal meningsmåling, hvor vi gerne vil finde ud af, hvor mange vælgere der stemmer på et parti, stiller vi spørgsmålet, hvilket parti respondenten ville stemme på, hvis der var valg i morgen (eller en afart af dette spørgsmål). Denne måde at spørge på garanterer blandt andet, at summen af opbakningen til de enkelte partier altid er lig 100 procent. Det er dog ikke hvad Voxmeter har gjort denne gang.

Voxmeter har eksempelvis ikke blot stillet ét spørgsmål. Der er stillet flere spørgsmål, der bidrager til at give de 10,8 procent. Det første spørgsmål respondenterne blev sat til at besvare, var: “Hvis det bliver muligt ved næste valg, vil du overveje at stemme på et parti, der har en strammere udlændingepolitik end Dansk Folkeparti?”. Med dette spørgsmål vil Voxmeter få respondenten til at basere sine overvejelser og valg på udlændingepolitik, og dermed ikke eksempelvis velfærd, miljø, vækst og hvad der ellers spiller en rolle i vælgernes overvejelser.

Det andet spørgsmål, som de 10,8 procent stammer fra, er ikke et klassisk partivalgsspørgsmål, men spørgsmålet: “Partiet Nye Borgerlige forsøger at blive opstillingsberettiget til næste valg. Partiet vil føre en stram udlændingepolitik som Dansk Folkeparti og en borgerlig økonomisk politik som Liberal Alliance. Vil du stemme på partiet, hvis det stiller op?”. Når en respondent svarer ja til dette spørgsmål, er det på ingen måde det samme som, at respondenten ville vælge Nye Borgerlige som svar, hvis spørgsmålet gik på, hvilket parti respondenten ville stemme på, hvis der var valg i morgen. Som Peter Kurrild-Klitgaard beskriver det: “Men det er meget tænkeligt, at vælgerne i praksis vil agere anderledes, når de i andre målinger eller på selve valgdagen (hvis partiet overhovedet får samlet de fornødne underskrifter), konfronteres med det fulde sæt af alternativer–inklusive dem de plejer at stemme på.”

De to spørgsmål – og især deres rækkefølge og konstruktion – bidrager begge til, at respondenterne svarer på et spørgsmål, der på ingen måde kan sammenlignes med et spørgsmål, der skal give et retvisende estimat af, hvor stor vælgertilslutning partiet vil få. Alene det forhold, at disse resultater ikke formidles sammen med en traditionel meningsmåling viser, at nærværende måling ikke skal tages seriøst. Kigger man på den seneste Voxmeter-måling (fra 12. juni), siger 1 procent af vælgerne, at de vil stemme på et andet parti end dem der er repræsenteret i Folketinget (heraf vil 0,7 procent stemme på Kristendemokraterne).

Dermed er det ikke sagt, at Nye Borgerlige ikke har et potentiale, men der er ingen meningsmåling, ej heller Voxmeters, der giver partiet 10,8 procent. Det bygger på tvivlsomme spørgsmål og en række antagelser af yderst urealistisk karakter. Meningsmålingen er med andre ord ikke en meningsmåling, der lever op til de standarder, man normalt arbejder med, og det kan undre en, at Voxmeter kvalitetsstempler meningsmålinger som disse.

Så nej, ingen meningsmåling viser, at “hver tiende vil stemme på Nye Borgerlige”. Det er blot et par dubiøse analytikere, der får det til at se sådan ud, for at skabe en god historie.

Oplæg for CBEN om nudging og metode

Forleden gav jeg et oplæg for Copenhagen Behavioural Economics Network (CBEN) om nudging og metode. Sidstnævnte er noget jeg beskæftiger mig meget med, og nudging har jeg berørt i diverse indlæg (se eksempelvis her, her og her).

Arrangementet bar titlen ‘The methods behind nudging‘. Mit oplæg var introducerende med fokus på metode, og især hvorfor det er vigtigt at tage metoden bag mange af diverse undersøgelser interesseret i nudging seriøst (også selvom man er en del af et felt, hvor det overvejende fokus er på nye og spændende teoretiske bidrag). Min simple pointe var, at al den viden om nudging der appliceres i det offentlige såvel som det private i disse år er rodfæstet i viden, men også en betydelig del bullshit, og den eneste måde hvorpå man kan adskille det videnskabelige fra den tomme snak, er ved at sætte sig ind i metode.

Foruden mit oplæg var der et spændende oplæg af Pelle Guldborg Hansen (fra iNudgeyou og RUC), der gik i dybden med, hvad nudging er – og mindst lige så vigtigt, hvad det ikke er. Fremmødet var imponerende (en blanding af universitetsansatte, studerende, konsulenter, embedsmænd m.v.), og jeg kan kun anbefale andre med interesse for nudging at deltage i fremtidige arrangementer.