En meningsmålingsjournalistikbot

Der er mindst tre generelle udfordringer for journalister, når de skal dække en ny meningsmåling:

  1. Fejl i tolkninger. Er en forskel i opbakningen til et parti statistisk signifikant? Dette er noget jeg har set talrige gange, og ligeledes skrevet en del om i tidligere indlæg. Blot fordi et parti går frem med to procentpoint, kan vi ikke konkludere, at denne fremgang også er en egentlig fremgang. Vi ser især mange fejlagtige tolkninger af den statistiske usikkerhed, når journalister skal tolke på en ændring mellem to meningsmålinger (se eksempelvis dette indlæg).
  2. Manglende informationer. Hvor mange blev spurgt i en meningsmåling? Hvor stor er den statistiske usikkerhed? Hvornår blev meningsmålingen foretaget? Dette er informationer, der bør formidles i dækningen af meningsmålinger. Dette har jeg også skrevet en del om over årene, og det er desværre ikke tilfældet, at medierne altid formidler disse informationer (se evt. vores artikel fra 2012 for mere hereom).
  3. Valg af fokus. Hvad skal der fokuseres på i dækningen af en meningsmåling? Fremgangen til et parti? Tilbagegangen til et andet parti? Begge? Er den primære historie at ingen partier har rykket sig? Eller at rød og blå blok er rykket tættere på hinanden? Der er mange forskellige vinkler at overveje, især når man sammenligner med tidligere meningsmålinger. Mit gæt er at de fleste journalister ikke når at overveje mere end en brøkdel af potentielle vinkler, når de formidler en meningsmåling.

Jeg har tænkt en del på, hvordan man bedst kan addressere disse udfordringer, herunder hvordan de er relateret til hinanden. Hvis en journalist laver en fejl i tolkningen af den statistiske usikkerhed, er det muligt at den statistiske usikkerhed slet ikke er formidlet – hvilket leder til et forkert valg af fokus.

Min tilgang har været at rette fokus på disse udfordringer i håbet om, at journalisterne og medierne generelt bliver bedre til at formidle meningsmålingerne. Dette har jeg gjort over det seneste årti (gennem artikler, samtaler med journalister, TV-indslag, blogindlæg m.v.), og det er min klare opfattelse, at mediernes dækning er blevet betydeligt bedre over tid (jeg siger hermed ikke, at jeg skal tage noget af æren – eller skylden – for, at dækningen ser ud, som den gør).

På det seneste har jeg tænkt mere over, om der er muligheder for, at robotjournalistik (også kendt som automatiseret journalistik), vil kunne spille en positiv rolle her. Konkret har jeg fået en idé til, hvordan en meningsmålingsjournalistikbot (beklager det lange ord – herefter blot kaldet meningsmålingsbot) ville være et godt arbejdsredskab for journalister, der skal formidle meningsmålinger.

Ideen er som følger: Når en ny meningsmåling bliver foretaget, vil en meningsmålingsbot sammenligne den nye meningsmåling med resultaterne fra andre meningsmålinger (vægtet gennemsnit), den seneste meningsmåling fra samme institut, seneste valgresultat, m.v., og gøre dette for de individuelle partier såvel som for interessante kombinationer heraf (eksempelvis rød og blå blok), og give information om, hvad der er den mest interessante vinkel, der er statistisk belæg for at fokusere på.

Fordelen ved dette er, at der ikke kan tages fejl i forhold til, om en forskel egentlig er statistisk signifikant eller ej, og det vil ikke være op til den enkelte journalist (eller analyseinstituttet) at finde ud af, hvad der kan være en interessant vinkel.

På den baggrund kan en meningsmålingsbot også skrive et udkast til en artikel. Dette vil sikre at de fornødne metodiske informationer også inkluderes, og i sidste instans aktivt skal fjernes af journalisten, hvis de ikke skal med. Det vil inkludere estimater for alle partier i meningsmålingen såvel som alle relevante metodiske detaljer.

Dette kunne laves på baggrund af en database med eksisterende artikler, der formidler meningsmålinger, hvor man får opbygget en systematisk oversigt over, forskellige måder at formidle meningsmålinger på, eksempelvis med forskellige ord og vendinger der kan bruges, når man skal formidle at et parti eller en blok går tilbage i meningsmålingerne. Teknisk forestiller jeg mig, at dette ville kunne sættes op i R, evt. med et Shiny dashboard som frontend-løsning, så det vil være nemt at anvende for journalister.

Dette ville selvsagt ikke løse alle udfordringer i mediernes dækning af meningsmålinger – og måske ligefrem introducere nogle nye udfordringer, men det ville være et godt udgangspunkt for journalister, hvis de let skal kunne sikre sig et overblik over, hvad en ny meningsmåling viser – uden selv at kigge på en lang række tal og finde ud af, om der er statistisk belæg for de sammenligninger, der kan laves.

Ideen er hermed givet videre til eventuelt interesserede.