Hvornår kommer folketingsvalget?

Da de første meningsmålinger kom ovenpå nedlukningen af Danmark, stod det klart, at Socialdemokratiet stod til en stor fremgang i meningsmålingerne og dermed sad tungt på magten. Ikke alene stod Socialdemokratiet stærkt, men rød blok havde et komfortabelt flertal.

Det er dog først i løbet af de seneste måneder, vi kan konkludere, at Socialdemokratiet har konsolideret deres opbakning i meningsmålinger. Der er dermed ikke tale om en kortsigtet effekt. End ikke minksagen ser ud til at have rykket nogle vælgere væk fra Socialdemokratiet.

Derfor vil jeg også tillade mig at komme med et kvalificeret gæt på, hvornår vi vil se et folketingsvalg: 16. november 2021.

Der er flere grunde til dette. For det første, som kvikke hoveder allerede har bemærket, er det samme dag som der er kommunal- og regionsvalg. Der afholdes normalt kun kommunal- og regionsvalg den samme dag, men der er tilfælde på tripelvalg, hvor der også afholdes folketingsvalg (senest i 2001). Hvis coronatallene desuden ser fine ud til den tid, kan det sågar være at foretrække at slå to fluer med ét smæk.

For det andet, og vigtigst af alt, går det godt for Socialdemokratiet. Kigger man på min seneste prognose står partiet til at få 32,2% af stemmerne. Det er omkring 20 procentpoint mere end Venstre, der nu ligger på niveau med Konservative.

Kigger vi på nogle af de seneste lokale meningsmålinger, ser det også godt ud for Socialdemokratiet. I Hedensted Kommune står partiet til at gå fra 27,8 pct. til 33,7 pct. af stemmerne, og der er lignende historier om fremgang til partiet i Horsens Kommune, Odense Kommune og Bornholms Kommune. Dette bekræfter hvad vi ved fra tidligere kommunalvalg, altså at der er en national valgvind, hvor partiernes nationale opbakning smitter af på deres opbakning ved kommunalvalget. En sådan valgvind kan potentielt blæse endnu stærkere, hvis valget afholdes samme dag, hvilket kan give Socialdemokratiet endnu et incitament til at udskrive valg.

Forskningen har vist, at politikerne er opportunistiske og er mere tilbøjelige til at udskrive valg før tid, når det går godt i meningsmålingerne (effektstørrelserne i studiet er dog små). Det vil være oplagt for Socialdemokratiet at smede mens folkestemningen er rød. Hvem ved hvordan folkestemningen ser ud om et år? Og hvad hvis blå blok kan nå at mobilisere et egentligt regeringsalternativ til den siddende regering? Det vil alt andet lige være optimalt for en regering, at udskrive valg i 2021.

Jeg kan selvsagt ikke gøre mig overvejelser om, hvorvidt Socialdemokratiet allerede har gjort sig overvejelser herom. Der er dog intet i deres adfærd eller udsagn hidtil, der synes at signalere, at de har tænkt sig at vente længe med at udskrive valget. Jeg vil sågar mene, at den seneste regeringsrokade, med endnu et ressortområde til Kaare Dybvad, så han også bliver indenrigsminister, vil klæde partiet godt på til et tripelvalg.

Det skal nævnes, at jeg ikke er den første til at lufte disse tanker. Erik Holstein, politisk kommentar for Altinget, udtalte således forleden til selvsamme Altinget: “Et valg til foråret er meget usandsynligt, men det er derimod en realistisk mulighed, at der kan komme et folketingsvalg i november sammen med kommunalvalget. Her vil Mette Frederiksen have en legitim undskyldning for at bede om et nyt mandat efter coronakrisen, og det vil se praktisk ud at slå de to valg sammen”.

Dette er selvfølgelig blot et gæt. Der er stadig mere end to år til, at der skal udskrives valg. Og end ikke politiske kommentatorer, der går meget mere op i dette end jeg, er altid enige om, hvornår der udskrives valg (se eksempelvis dette indlæg fra 2015). Ligeledes er der stadig en masse ubekendte variable (hvordan vil det gå med coronavaccinerne? hvordan vil det gå med opbakningen i målingerne?), men hvis det fortsætter som hidtil, har jeg svært ved at se, hvorfor Mette Frederiksen ikke skulle udskrive valg med afholdelse 16. november 2021.

Huseffekter i meningsmålingerne

Når vi kigger på kvalitetsvægtede gennemsnit af meningsmålingerne forsøger vi at tage højde for såkaldte huseffekter, altså hvordan de forskellige analyseinstitutter systematisk giver partier en større eller mindre opbakning end de andre analyseinstitutter.

Jeg har over årene været med til at udregne huseffekter i meningsmålingerne (se eksempelvis Politiken i 2015 og TV 2 i 2017). Jeg har ligeledes fremhævet vigtigheden af at kigge på huseffekter, når jeg har talt med eksempelvis Altinget og DR ifm. 2019-valget.

Hvad jeg har savnet er dog ét sted, hvor huseffekterne bliver opdateret mere regelmæssigt, så jeg ikke behøves henvise til ældre artikler om emnet. Denne resource har jeg nu lavet og den kan findes her. De ser ud som følger:

Vi kan se, at der er uenighed om især opbakningen til Nye Borgerlige og Venstre hos YouGov og Voxmeter. Bemærk, som jeg også skriver på siden, at dette ikke er ensbetydende med, at disse institutter tager fejl.

Har du forslag til forbedringer eller tilføjelser, modtager jeg gerne feedback.

Global risks, climate change and COVID-19

On 15 January 2020, the World Economic Forum released The Global Risks Report 2020. The report was published before we talked about COVID-19 which makes it an even more interesting read. There are a lot of risks in the world. Weapons of mass destruction, food crises, natural disasters, climate change, data fraud, unemployment, asset bubbles etc. All of these risks differ in likelihood and potential impact.

Here is the global risks landscape of 2020 according to the report:

We can see a few things here. First, there is a positive correlation between likelihood and impact (with weapons of mass destruction being an outlier). Second, most of the likely risks with a high impact are related to climate change. This is in line with what the economist Dina D. Pomeranz wrote on 31 December 2019: “The key issue that can endanger much of the progress the world have achieved in so many areas is climate change.” Third, infectious diseases is not that likely, and it is even more likely that we would face a critical infrastructure failure rather than infectious diseases.

Of course, what we know now is that infectious diseases would be a severe problem in 2020. However, on the risks landscape above it is below average in terms of likelihood. This might simply reflect that we are not good at considering the tail risk of contagious diseases. The global risk report is based upon survey data on risk perceptions and will, for that reason, not reflect the actual likelihood of an event happening.

Tuesday, World Economic Forum launched their 2021 Global Risks Report. The top risks in terms of impact are now infectious diseases, climate action failure and weapons of mass destruction. Here is the new global risks landscape:

It is clear that the two risks with the biggest impact and likelihood are infectious diseases and climate action failure. But how should we think about these two risks? One possibility is to see them as unrelated. This would indicate that we should focus now on COVID-19 and then focus on climate change. However, I believe there are profound reasons for not see the risks as unrelated. On the contrary, these risks are correlated.

Noteworthy, there are important temporal differences between the two risks. While the climate crisis is happening right now, the key difference between the two crises is, in the words of Lidskog et al. (2020), the “urgency of action to counter the rapid spread of the pandemic as compared to the slow and meager action to mitigate longstanding, well-documented, and accelerating climate change”.

Risks are correlated and we cannot talk about infectious diseases as something that is completely unrelated to climate change. However, I believe that these risks will not be identical over time. Specifically, my sense is that the risks are negatively correlated in the shorter term but positively correlated in the longer term.

What we have primarily seen in the coverage of climate change in the wake of the COVID-19 pandemic are stories about less pollution. We have all seen the various pictures of nature and subsequent “nature is healing” memes. COVID-19 led to a reduction in global CO2 emissions and air pollution, demonstrating certain short-term effects of the pandemic. Of course, this is not sustainable in the future and we cannot conclude that the solution to climate change is another pandemic.

On the contrary, climate change will make pandemics worse. Pandemics are related to the destruction of nature and will get worse because of climate change. Specifically, climate change is making it more likely that we will experience similar vira in the future, as described by Colin Carlson, an ecologist at Georgetown University, to Ed Yong: “the biggest factors behind spillovers are land-use change and climate change, both of which are hard to control. Our species has relentlessly expanded into previously wild spaces. Through intensive agriculture, habitat destruction, and rising temperatures, we have uprooted the planet’s animals, forcing them into new and narrower ranges that are on our own doorsteps. Humanity has squeezed the world’s wildlife in a crushing grip—and viruses have come bursting out.”

The key point is that we should treat the risk of pandemics and climate change within the same framework. Luckily, there has already been quite some attention to how the recovery from COVID-19 has to be green. In other words, it is not about returning to the world pre-COVID-19, but make a green recovery. The pandemic is a chance to do better for the climate and transition from a ‘brown’ to a ‘green’ economy over the next ten years. There are different ways to move forward and a strong green stimulus can meet global net-zero CO2 by 2050.

What we should care about is the long-term recovery and in particular the short-term costs to ensure long-term sustainability. One of the concerns is that climate change is already happening and COVID-19 is an inequality accelerator. For example, those who already experience the huge cost of climate change do more so during the pandemic. Again, the global risks related to pandemics and climate change are interconnected.

The good news is that, even in the midst of the pandemic, the public perceives climate change as a great threat – including in the United States and in Europe. The bad news is that there are important differences between a pandemic and climate change. Specifically, as Ramez Naam notes, “coronavirus is actually a much easier challenge for people to conceptualize”. Unsurprisingly, those who are more likely to be concerned about the pandemic and wear a mask will also be more likely to be concerned about climate change. For that reason, alas, I expect many of the challenges we have seen during the pandemic to still be relevant long after COVID-19.

We cannot self-isolate from the effects of climate change, but hopefully the experience with COVID-19 will have increased our understanding of global risks and enable scientists and politicians alike to address the risks of both infectious diseases and climate change.

Hvor mange vil stemme på Lars Løkke Rasmussens parti?

B.T. kan rapportere, at fire procent af danskerne med sikkerhed vil stemme på Lars Løkke Rasmussen eller hans nye parti, skulle han gå hen og stifte et. B.T. kalder det for en “vild måling”, og det er jeg enig i, at det er en vild måling. Jeg kalder det blot en vild måling fordi den er metodisk mærkelig. Der er tale om endnu et eksempel til rækken af sager, der viser, at man bør være ekstra skeptisk for en måling, hvis den kommer fra YouGov.

Målingen kan ingenlunde sammenlignes med meningsmålinger, som vi kender dem. Her er det konkrete spørgsmål, man har stillet respondenterne: “Tidligere statsminister Lars Løkke Rasmussen har meldt sig ud af partiet Venstre og har nu startet et nyt politisk netværk. Lars Løkke Rasmussen afviser ikke, at det kan udvikle sig til et egentlig parti. Hvor tilbøjelig vil du være til at stemme på Lars Løkke Rasmussen og/eller hans nye parti, hvis han gør alvor af sine tanker om stifte et nyt parti?”

Ikke alene beder man respondenterne om at forholde sig til et hypotetisk parti (der ikke eksisterer), men også om man vil overveje at stemme på dette éne parti. Som Hans Redder fra TV 2 korrekt formulerer det: “Det her er altså en virkelig ringe måde at lave meningsmålinger på. I stemmeboksen skal vælgerne ikke tage stilling til ét, men blandt alle opstillede partier”.

Jeg har i tidligere sammenhænge beskrevet, hvordan denne slags målinger ikke kan bruges til at sige noget om partiernes opbakning i meningsmålingerne, eksempelvis med Nye Borgerlige, Danskernes Parti og Klaus Riskær Pedersen. Den slags målinger bruges udelukkende til at overestimere opbakningen til et parti i meningsmålingerne, så B.T. (og andre medier uden journalistiske standarder) kan skrive historier om vilde målinger. Du kommer derfor aldrig til at se en meningsmåling som denne, hvor historien lyder, at der ikke er potentielle vælgere til et parti.

Dertil skal det også tilføjes, at vi efterhånden ved, at YouGov har store udfordringer forbundet med at måle vælgernes opbakning. De klarede sig dårligst af alle ved det seneste folketingsvalg, og intet tyder på, at der er grund til at tage dem mere seriøst nu. Jeg antager desuden, at spørgsmålet om, hvor mange der kan overveje at stemme på Lars Løkke Rasmussens nye parti er stillet i samme meningsmåling, der giver Venstre en historisk lav opbakning (men hvor de fire ud af fem største partier er blå partier!). Det ville i så tilfælde også være interessant at vide om YouGov har stillet deres Lars Løkke-spørgsmål før eller efter spørgsmålet om, hvilket parti vælgerne ville stemme på, hvis der var valg i morgen.

Vi ved ikke, hvor mange der vil stemme på Lars Løkke Rasmussens nye parti. Det er rent gætværk, når Henrik Qvortrup forsøger at estimere, at partiet “ved næste folketingsvalg realistisk set vil kunne høste seks-syv procent af stemmerne og dermed storme ind i Folketinget med sit nye midterparti”. Mediernes dækning er ikke neutral, når det kommer til dækningen af nye (eller i dette tilfælde ikke-eksisterende) partier, men det ville klæde YouGov såvel som B.T. at forbedre deres måde at foretage såvel som at formidle meningsmålinger på.

Potpourri: Statistics #70 {gt}

gt – a (G)rammar of (T)ables
Functions and Themes for gt tables
Beautiful Tables in R: gt and the grammar of tables
Embedding custom HTML in gt tables
A 3-way crosstab table using {gt}
Replicating a New York Times Table of Swedish COVID-19 deaths with gt
Spending on Education
The Big Mac Index Table
gtsummary: Presentation-Ready Data Summary and Analytic Result Tables


Previous posts: #1 #2 #3 #4 #5 #6 #7 #8 #9 #10 #11 #12 #13 #14 #15 #16 #17 #18 #19 #20 #21 #22 #23 #24 #25 #26 #27 #28 #29 #30 #31 #32 #33 #34 #35 #36 #37 #38 #39 #40 #41 #42 #43 #44 #45 #46 #47 #48 #49 #50 #51 #52 #53 #54 #55 #56 #57 #58 #59 #60 #61 #62 #63 #64 #65 #66 #67 #68 #69

How not to measure conspiracy beliefs #3

Here is a brief update to my two previous posts on the flawed study published in Psychological Medicine. To recap, the study found that almost half of the respondents in a UK sample agree that the “[c]oronavirus is a bioweapon developed by China to destroy the West”.

In a new study, John Garry, Rob Ford and Rob Johns find that this number is most likely closer to 30% than 50% of the UK population (in a representative sample from Deltapoll). The authors address the criticisms raised in the previous posts and find that the belief in COVID-19 conspiracy theories is indeed lower when we take some of these methodological limitations into account.

It is great to see additional studies tackle these survey design issues and provide estimates on the “true” proportions. I highly recommend that you read the study.

I do not have a lot to add here except for two points. First, I am surprised by the numbers in Garry et al., i.e. that even when we use a “best practice” approach, the numbers are very high. The authors argue that the “prevalence of support for coronavirus conspiracies is only around five-eighths (62.3 percent) of that indicated by the Freeman et al. approach”, but I am not sure I would use “only” here. This is still a lot. In other words, if anything, I am surprised that the flaws in the original study did not matter more, especially when comparing the results to that of Douglas and Sutton (though they rely on a convenience sample).

Second, while the study also aims to provide more valid estimates on the causal effect on beliefs in conspiracy theories in compliance, I am not convinced the authors can say anything meaningful about this. Take this argument in the paper: “Of course, estimates of any causal effect of conspiratorial beliefs on compliance requires not just good measurement but also a move beyond bivariate correlations. By taking a step in that direction with controls for trust in various actors, we have provided a more restrained estimate of the potential effect of conspiracy beliefs on adherence.” Specifically, I am not convinced that simply controlling for trust in various actors will provide better estimates (there are multiple potential pathways between trust in actors, conspiratorial beliefs and compliance that cannot easily be addressed by adding covariates to a multiple linear regression model).

Again, it is great to see additional empirical attention to the question of how many people actually hold conspiratorial beliefs. The numbers in the original study were extreme, but maybe not as extreme as I would have initially thought.

How to improve your figures #2: Don’t show overlapping text labels

I was reading this study on the impact of Weberian bureaucracy on economic growth published in Comparative Political Studies. It’s a great article and I can highly recommend reading it.

I like that the study presents most of the results in figures. In fact, there are more figures than tables in the article. However, a few of the figures present several data points (countries) in scatter plots with labels to all points (country names). Here is one example:

As you can see, several country labels overlap with each other making it difficult to read the country names. The problem is not as severe as it could have been (as the authors have made the height greater than the width, making more space for horisontal text). However, for a lot of the labels it is simply not possible to read the country names.

Importantly, this is not only about aesthetics. When several country labels overlap, it is no longer possible to see whether there are actual data points hidden by the labels.

To improve the figure, my suggestion would be to only show some of the value labels. In the figure below I have tried to only show the country names for the countries that you can actually read in the figure above.

In my view, this is a clear improvement of the original figure.

My R-script to create the figure is here:

library("tidyverse")
library("haven")

bureaucracygrowth <- read_dta("22725104_Replication_data_Bureaucracy_Growth.dta")

bureaucracygrowth %>% 
  mutate(country_name_show = case_when(
    v2stcritrecadmv9 < -1  ~ country_name,
    QoG_expert_q2_a > 6.3 | QoG_expert_q2_a < 2 ~ country_name,
    v2stcritrecadmv9 > 0.7 & QoG_expert_q2_a < 3.5 ~ country_name,
    v2stcritrecadmv9 < 1 & QoG_expert_q2_a > 4.4 ~ country_name,
    TRUE ~ ""
  )) %>% 
  ggplot(aes(v2stcritrecadmv9, QoG_expert_q2_a)) +
  geom_smooth(method = "lm", se = FALSE) +
  ggrepel::geom_text_repel(aes(label = country_name_show)) +
  geom_point() +
  theme_minimal() +
  labs(y = "Meritocratic recruitment (QoG expert-survey), 2014",
       x = "Meritocratic recruitment (V-Dem), 2014")

ggsave("bureaucracygrowth.png", width = 6, height = 6)

Kvaliteten af meningsmålingerne ved kommunalvalget

Den 16. november står den på kommunalvalg. I den forbindelse kommer vi til at se op til flere meningsmålinger fra landets større kommuner, og det bliver især de lokale medier, der ikke har for vane at formidle meningsmålinger, der skal formidle selvsamme.

Dette kommer dog til at være en udfordring for mange journalister, der har tæt på ingen erfaring med at formidle meningsmålinger. Jeg har i løbet af de seneste måneder set flere eksempler på dårligt formidlede meningsmålinger (ingen nævnt, ingen hængt ud). I dette indlæg vil jeg derfor give et godt eksempel på, hvordan en meningsmåling kan formidles i den lokale journalistik. Mit ønske er, at alle andre lokaljournalister vil følge dette eksempel, når de i løbet af i år skal formidle deres kommunalvalgsmeningsmålinger.

For nogle måneder siden kunne TV 2 Fyn bringe en meningsmåling foretaget af Megafon, der viste, at Socialdemokratiet stod til at få 30,3% af stemmerne. Denne artikel formidler opbakningen til alle partierne (i procent), giver det eksakte spørgsmål respondenterne er blevet stillet (“Hvem ville du stemme på, hvis der valg til byrådet i dag?“), formidler den eksakte indsamlingsperiode, formidler den statistiske usikkerhed osv.

Sådan ser en god meningsmålingsartikel ud. Kort fortalt er det en meningsmåling, der lever op til standarderne god meningsmålingsjournalistik. Mit håb er som sagt at andre lokale medier vil følge TV 2 Fyns eksempel. Der er mange spørgsmål man kan stille til meningsmålinger (jeg præsenterede en liste med 20 af sådanne spørgsmål for fem år siden), men hvis de lokale medier følger ovennævnte eksempel, bør alt være fint.

Hvor lav er opbakningen til Venstre?

Den sidste Voxmeter-måling for Ritzau i 2020 giver Venstre 17,3% af stemmerne. Hvor lavt ligger partiet så? YouGov har haft Venstre omkring 15% men de fleste analyseinstitutter synes at give partiet omkring 17% af stemmerne. Ritzau formulerede på baggrund af Voxmeter-målingen følgende (der kan læses hos bl.a. BT og Kristeligt Dagblad):

Ifølge en opgørelse fra hjemmesiden Politologi, der drives af dataanalytiker og ph.d. Erik Gahner Larsen, har Voxmeter ellers været et af de institutter, der har givet Venstre de bedste målinger gennem efteråret.

Dette er korrekt, men Voxmeter er som bekendt blot ét analyseinstitut – og der er ikke nødvendigvis tale om en stor ændring på det seneste i Venstres opbakning. Her er hvad min prognose viser for Venstre:

Som vi kan se faldt opbakningen til Venstre signifikant ovenpå coronanedlukningen i marts, fra omkring 22% til 20% af stemmerne. I løbet af sommeren er partiet så faldet omkring yderligere 2 procentpoint. De seneste meningsmålinger tyder på, at opbakningen er mellem 16% og 18%, og den seneste prognose giver Venstre 17% af stemmerne.

Overordnet er der tale om meget små ændringer i målingerne i løbet af de seneste par måneder, og historien om Venstres opbakning i meningsmålingerne i 2020 er en historie om et parti der især mistede vælgere i løbet af pandemiens første periode og nu har svært ved at komme tilbage – alt imens andre partier på højrefløjen (Konservative og Nye Borgerlige) klarer sig formidabelt.

Potpourri: Statistics #69

Hands-On Data Visualization: Interactive Storytelling from Spreadsheets to Code
Reflecting on “Vote Cones”
Least squares as springs
Applying PCA to fictional character personalities
Bayes Rules! An Introduction to Bayesian Modeling with R
tiktokr: An R Scraper for Tiktok
Efficient and beautiful data synthesis: Taking your tidyverse skills to the next level
A Gentle Introduction to Tidy Model Stacking
11 Short Machine Learning Ethics Videos
Your first R package in 1 hour
What is a dot plot?
JavaScript for R
Literature on Recent Advances in Applied Micro Methods
In Fallout Over Polls, ‘Margin of Error’ Gets New Scrutiny
Programming Choice Experiments in Qualtrics
The list of 2020 visualization lists
The 9 concepts and formulas in probability that every data scientist should know
Collapse repetitive piping with reduce()
Economics charts in R using ggplot2
Top 10 tips to make your R package even more awesome
Running R Scripts on a Schedule with GitHub Actions
Leveraging labelled data in R
Creating and using custom ggplot2 themes
Advanced R Course
The intuition behind averaging
Underrated Tidyverse Functions
Bullet Chart Variants in R
Using the tidyverse with Databases – Part I


Previous posts: #1 #2 #3 #4 #5 #6 #7 #8 #9 #10 #11 #12 #13 #14 #15 #16 #17 #18 #19 #20 #21 #22 #23 #24 #25 #26 #27 #28 #29 #30 #31 #32 #33 #34 #35 #36 #37 #38 #39 #40 #41 #42 #43 #44 #45 #46 #47 #48 #49 #50 #51 #52 #53 #54 #55 #56 #57 #58 #59 #60 #61 #62 #63 #64 #65 #66 #67 #68