Hyperintelligente superalgoritmer

Politiken kan fortælle, at “en digital superalgoritme med hidtil uset præcision” kan kortlægge hadefulde kommentarer på Facebook. Jeg har ingen idé om, hvad en superalgoritme er, men det skal man nok være enten astrofysiker eller journalistpraktikant for at vide. I en anden artikel kalder Politiken det for en “hyperintelligent algoritme”. Jeg ved heller ikke, hvad dette er. Der er intet i de pågældende artikler, der giver anledning til at konkludere, at der er tale om noget ekstraordinært.

Her er et godt råd til, når du læser artikler omkring kunstig intelligens (AI), maskinlæring, big data og lignende: Jo mere begrebsmæssig hype der er, desto mindre er der at tage seriøst. Hvis der virkelig er noget at komme efter, er der ikke brug for at pakke indholdet ind i termer som hyperintelligente superalgoritmer.

Det er ikke første gang vi ser denne slags artikler, men det er nok sidste gang du vil høre om den konkrete algoritme. Jeg udelukker ikke, at vi kommer til at støde på den konkrete algoritme (eller mere specifikt de to algoritmer) igen, men det er svært at se – med den information, der er offentlig tilgængelig – hvad der er selve nyhedsværdien set fra et maskinlæringsperspektiv.

I forhåndenværende tilfælde ser jeg primært Politikens dækning som en annonce for et analysebureau ved navn Analyse & Tal, der har en interesse i at skabe så meget hyperintelligent hype som muligt omkring deres superkompetencer (og derfor selvsagt ikke evner at forholde sig kritisk til deres produkt i et omfang man kunne ønske, hvis man skulle tage deres arbejde alvorligt i forhold til at forbedre den demokratiske samtale på sociale medier).

Konkret viser deres arbejde, at deres algoritme kan præsentere en F1-score (et samlet mål for præcision og genkaldelse), der har en værdi, der er 0,02 bedre end den hidtil bedste danske algoritme (når det kommer til at identificere sproglige angreb). Det er meget pæne resultater, men jeg vil undlade at gøre mig klog på, hvad der kan betegnes som “hidtil uset præcision”.

Der foreligger ingen (forsknings)artikel eller teknisk appendiksmateriale, der beskriver algoritmen med det mærkværdige navn At&tack-Ha&te (igen, som en annonce for Analyse & Tal), så jeg skal også holde mig fra en egentlig gennemgang af deres metode (du kan finde en introduktion i præsentationsformat her). Der er så mange detaljer, der er udeladt i det offentligt tilgængelige materiale, at det end ikke giver mening at kommentere på resultaterne. Jeg kan dog blot nævne, at det umiddelbart virker som et godt eksempel på, at deep learning ikke nødvendigvis giver dybe indsigter – med mindre Analyse & Tal selvfølgelig ligger inde med nogle guldkorn, de ikke har præsenteret for offentligheden.

Jeg forstår godt, at Politiken såvel som Analyse & Tal har en fælles interesse i at gøre ting mere revolutionerende end de er med begreber som hyperintelligente superalgoritmer, men der er absolut intet i det offentligt tilgængelige materiale, der besvarer, hvad der er hyperintelligent og/eller super ved deres algoritmer.