Erik Gahner Larsen

A dataset with political datasets

I am working on an overview of political datasets (as usual, old news for the people following me on Twitter). My aim is to collect as many datasets as possible of relevance to political science students and researchers. You can find the dataset here (in different file formats).

The dataset has datasets related to cabinets, parliaments, public opinion, constitutions, political institutions, parties, politicians, democracy, governance, economics, elections, international relations, news media, policy indicators, political elites and more.

There is a few points to keep in mind. First, the dataset has over 150 datasets but it is still work in progress and I need to collect relevant info for all datasets. Second, in line with the principles of open science, the overview, while not limited to, is overrepresented by datasets freely available online.

If you have any suggestions, feedback or comments, feel free to contact me or create an issue in the repository.

Nyt bogkapitel: Logistisk regression med binært udfald

Har skrevet et kapitel om binær logistisk regressionsanalyse til den nye bog, Videregående kvantitative metoder. Bogen er redigeret af M. Azhar Hussain og Jørgen Trankjær Lauridsen, der begge har gjort et fantastisk stykke arbejde.

Kapitel 3, Logistisk regression med binært udfald, giver en introduktion til, hvordan man gennemfører logistiske regressionsanalyser. Helt konkret beskrives tre procedurer, der bør gennemføres i forbindelse med en god logistisk regression: 1) estimering af en model, 2) udregning af forudsagte sandsynligheder og 3) visualisering af resultaterne.

Hele bogen er bygget op med et praktisk fokus på, hvordan tingene gøres i Stata. Do-filen til mit kapitel kan findes her.

Deles 92% af danske nyhedshistorier på Facebook?

Har sammen med Kim Andersen skrevet et indlæg til TjekDet omkring metoden i den nye rapport fra Slots- og Kulturstyrelsen, ‘Mediernes udvikling i Danmark 2017‘. Konkret tager vi udgangspunkt i en påstand i rapporten om, at 92% af danske nyhedshistorier deles på Facebook.

Der er som minimum to metodiske problemer, der begge relaterer sig til hvor repræsentativ undersøgelsen er. For det første at ugen, der er undersøgt i undersøgelsen, ikke nødvendigvis er repræsentativ for mediernes generelle dækning. For det andet at de emner, der er undersøgt i undersøgelsen, ikke nødvendigvis er repræsentative for alle de emner, medierne skriver om.

På baggrund af vores kritik giver Lars Holmgaard Christensen, medieforsker ved Aalborg Universitet, og Lasse Skjoldan, senior advisor hos Infomedia, et fint svar, der er at finde nederst i indlægget. Det hele kan findes her.

Er et flertal af danskerne klar til et opgør med konventionerne?

Hos Altinget kan man læse, at opbakningen til den europæiske menneskerettighedskonvention er på vippen. Baggrunden for denne konklusion er en meningsmåling foretaget af Norstat, der viser, at 48% af danskerne mener, at Danmark bør være klar til at træde ud af konventionen.

Det relevante spørgsmål er dog, om halvdelen af danskerne går rundt med den opfattelse, at Danmark bør være klar til træde ud af konventionen. Dette udtaler jeg mig om i en faktatjek-artikel hos Mandag Morgens TjekDet, der kan findes her.

Hvorfor styrtdykkede Dansk Folkeparti i meningsmålingerne?

Hos TV 2 er man i fuld sving med at perfektionere kunsten at skabe noget ud af intet. Dette er smukt at studere, som et andet kunstværk, eksempelvis Guernica, men det har intet med god journalistik at gøre. På det seneste har man således set TV 2 finde store politiske historier i tilfældig støj, eksempelvis i forbindelse med opbakningen til de Konservative og Socialdemokraterne. Nu er det så Dansk Folkepartis tur.

I løbet af sommerferien kunne TV2 rapportere, at Dansk Folkeparti stod til at få 13,3% af stemmerne. Samme måling dannede udgangspunkt for en artikel hos Politiken om Dansk Folkepartis nedtur i målingerne. Hvorfor tabte Dansk Folkeparti så mange stemmer? Anders Langballe udtalte til TV 2: “Det er svært at sige, hvad der giver den mekanisme, men noget kan tyde på, at DF taber på de meldinger, de kommer med sammen med S”. Forkert. Der er tale om enkeltstående målinger.

Da målingen kom forudsagde jeg, at den næste måling ville vise, at Dansk Folkeparti ville have en større opbakning (regression toward the mean). Nu har vi så fået den næste måling fra Megafon, og her går Dansk Folkeparti selvfølgelig frem. Dette får lige så selvfølgeligt ikke ét ords omtale hos TV 2. Figur 1 viser Dansk Folkepartis opbakning i meningsmålingerne over de seneste 5 måneder. Bemærk at Megafon skyder langt under hvad andre respekterede institutter giver Dansk Folkeparti af opbakning.

Figur 1: Dansk Folkepartis opbakning over 5 måneder

I et interview til TV 2 i forbindelse med den første Megafon-måling sagde Peter Skaarup: “Den her måling virker godt nok skæv, for hvis vi kigger på det gennemsnit der er af de her målinger, der løbende kommer, så ligger Dansk Folkeparti på et bedre niveau. På en 18-19 procent. Og det viser de andre målinger, der også er lavet over de seneste uger. Så jeg kan ikke rigtigt finde nogen forklaring på, hvorfor den her ligger så forholdsvist anderledes.”

Til dette burde en kompetent journalist kunne svare, at det nok skyldes den statistiske usikkerhed. På TV 2 spørger journalisten i stedet: “Er det ikke bare fordi du ikke kan lide budskabet, måske, Peter Skaarup?”. Hvortil han korrekt svarer: “Nej, det er det faktisk ikke. Og jeg tror også man skal passe på med at lægge for meget i én måling eller to for så vidt. Og det gælder både pressen og os politikere.” Spot on.

Der er statistisk støj og systematiske forskelle mellem institutterne, der gør, at man skal være varsom med at konkludere for meget på baggrund af én meningsmåling. Denne pointe har jeg formuleret i et tocifret antal indlæg (de fleste her på siden), hvorfor man som tilskuer til mediernes formidling af meningsmålingerne nemt kan føle sig som deltager i en nyfortolkning af Groundhog Day.

Derfor kan det også være interessant at dvæle lidt ved, hvad der gør det svært at ramme især Dansk Folkeparti korrekt i disse måneder. En del af udfordringen er her, at det generelt er svært at sige, hvor stor opbakningen er til de respektive partier på den yderste højrefløj. Jeg har flere gange fremhævet dette i forbindelse med opbakningen til Nye Borgerlige (se her, her, her, her og her).

Her kan vi kigge nærmere på meningsmålingerne fra 2017. I denne periode har Nye Borgerlige været en del af mediernes dækning længe nok til at vi kan konstatere, at der ikke længere er tale om et helt nyt parti, men hvor institutterne stadig har svært ved at ramme Nye Borgerliges opbakning blandt vælgerne. Her ser vi da også, at denne opbakning relaterer til sig opbakningen til Dansk Folkeparti. Figur 2 viser opbakningen til Dansk Folkeparti på x-aksen og opbakningen til Nye Borgerlige på y-aksen.

Figur 2: Relationen mellem Dansk Folkepartis og Nye Borgerliges opbakning

Korrelationen mellem opbakningen til henholdsvis Dansk Folkeparti og Nye Borgerlige er -0,7. Dette vil sige, gennemsnitligt betragtet, at når Nye Borgerlige står godt i en meningsmåling, står Dansk Folkeparti dårligt. Når vi ved hvor svært institutterne har ved at komme med et reelt bud på, hvor stor opbakningen er til Nye Borgerlige (den seneste Voxmeter giver partiet 0,6% af stemmerne, den seneste Megafon 3,5%), vil dette også give nogle udsving i Dansk Folkepartis opbakning, der ikke kan tilskrives reelle vælgervandringer.

Dette er selvfølgelig ikke det samme som at sige, at vi ikke skal kunne komme med kvalificerede bud på, hvor stor opbakningen er til Dansk Folkeparti, ej heller Nye Borgerlige, men at vi – når der er bestemte udfordringer forbundet hermed – skal være endnu mere påpasselige med blindt at tro på enkeltmålinger.

Hvorfor styrtdykkede Dansk Folkeparti så i meningsmålingerne? Det korte svar: fordi TV 2 siger det. Det gør det dog ikke til en korrekt påstand. Der er ingen evidens for, at Dansk Folkeparti har ligget på omkring 13% af stemmerne, og det bør være journalisternes opgave at korrigere den opfattelse, snarere end at underbygge den med Megafon-målinger, politiske kommentatorer, halvstuderede analyser m.v.

Potpourri: Statistics #39

House effects in Danish opinion polls

While opinion polls are great they are also subject to a multitude of potential systematic errors. Some of these errors are related to the fact that polling firms rely on specific methods that might shape the results (so-called ‘house effects’). Some firms, for example, rely on internet panels when they recruit respondents, whereas other firms call people on their phones. Such differences might affect the results in opinion polls.

In an analysis of all Danish opinion polls on the public support for political parties from 2010 to 2017 (n=1,062), Zoltán Fazekas and I examined whether such house effects are present for the national political parties. In doing this, we relied on the Bayesian approach described in Jackman (2005) to estimate house effects for each of the 10 parties (90 estimates in total given the 9 polling firms).

Figure 1: House effects in Danish opinion polls, 2010-2017

Figure 1 presents the results with the 10 parties on the vertical axis and the nine polling firms on the horizontal. If there are no house effects in the polls for a party, we will see no circles on the horizontal line next to a party. The greater a house effect is for a party in the polls from a specific polling firm, the greater the circle will be (the size of the circle is proportional to the magnitude of the house effect). When the house effect is negative, i.e. the polling firm estimate a lower support for a party, the circle is red. The blue circles are for positive deviations. The gray color is for effects where 0 falls within the 95% credible interval.

TV 2 covered the analysis (in Danish) with additional interpretations of the results. Subsequently, the analysis was also covered by Mandag Morgen (also in Danish).