Krönikor
”Ett rättvist uppladdningsfilter är tekniskt omöjligt”
ANALYS. Artikel 13 kan tvinga internettjänster att filtrera innehåll i jakten på upphovsrättsintrång. Men den artificiella intelligens som kan skilja satir från en piratkopia finns inte, skriver Ny Tekniks reporter Simon Campanello.
Under våren är det tänkt att EU slutligen ska rösta igenom ett nytt upphovsrättsdirektiv. Den kanske allra mest kontroversiella punkten i skriften är Artikel 13, den som ska tvinga internettjänster att hindra användarna från att ladda upp upphovsrättsskyddat material.
Artikel 13 får mig att tänka på en (i vissa snäva kretsar) populär meme om artificiell intelligens. Bilden föreställer en katt, och bredvid katten står texten ”dog”.
Bilden brukar levereras ihop med en fyndig kommentar. I en variant från förra året skriver en Discord-användare vid namn Kaenbyou: ”60+ hours on 16 GPU nvidia CUDA cluster”.
Jag hatar att vara den som förklarar ett skämt, men på ren svenska betyder det ungefär ”jag lät mina 16 grafikkort ägna över 60 timmar åt att lära en ai att klassificera bilder och det här är resultatet”. Bilden ackompanjeras gärna med en rad om hur osannolikt det är att robotarna tar över våra jobb.
Ändå är det vad EU vill. Ge robotarna i jobb att klassificera bilder, fast i mycket, mycket större skala.
Ett filter är enda lösningen
Om Artikel 13 blir verklighet kommer det innebära att stora internettjänster där användarna kan ladda upp eget innehåll behöver börja filtrera. Med hjälp av algoritmer ska uppladdat innehåll jämföras mot en databas av upphovsrättsskyddat material, och misstänkta brott ska genast stoppas.
Upphovsrättsdirektivets förespråkare brukar vid det här laget rasande poängtera att det minsann inte finns en enda rad i EU-texten om något uppladdningsfilter.
Det vet jag, för nästan varje dag får jag ett pressmeddelande från någon lobbyorganisation som förklarar läget. Så sent som i dag fick jag ett bestämt mejl från en upphovsrättsorganisation som bett självaste Lasse Åberg säga ifrån på skarpen. Det viktiga är inte metoden, utan att ingen får begå upphovsrättsintrång på hans Musse Pigg-teckningar.
Men rent krasst finns det inte särskilt många lösningar för att lyckas.
Bara på Youtube laddar användarna enligt flera bedömmare upp över 500 timmar video varje minut. Stämmer siffran motsvarar det minst 720 000 timmar video varje dag. Skulle videorna rensas på upphovsrättskyddat material manuellt skulle minst 90 000 heltidsanställda behöva ägna varje dag åt att utan rast leta igenom filmerna. Det är nästan hela Googles samlade personalstyrka.
En rimligare lösning är att automatisera processen. Artificiell intelligens som lärts upp att känna igen ljud och bild från upphovsrättsskyddat material får sålla igenom de hundratusentals timmarna video i jakt på förbrytarna. Och då är vi i händerna på de algoritmstyrda uppladdningsfiltren.
Ai kan inte skilja satir från intrång
Tekniken kommer förstås vara mycket mer finslipad, och kan säkert skilja hund från katt nio gånger av tio. Men visa mig en artificiell intelligens som kan skilja satir från upphovsrättsintrång och jag lovar att det landar en påse riskkapitalpengar på ditt skrivbord snabbare än du kan blinka.
Vi är helt enkelt inte där. Inte ännu, och kanske inte någonsin. Föreställ dig alla miljarders miljarder som stora teknikföretag lagt på att med hjälp av artificiell intelligens visa relevant reklam för dig. Fundera sedan om du någonsin köpt en brödrost på en webbshop utan att i veckor bombarderas av reklam för samma brödrost, trots att du rimligen inte kommer att köpa en till.
En säljare på Elgiganten hade knappast stoppat dig på väg ut ur butiken, pekat på kassen med din nyinköpta brödrost och frågat dig om du var sugen på att köpa just en sådan brödrost. Artificiell intelligens må har gjort enorma framsteg under de senaste åren, men det finns områden där mänsklig intelligens ännu triumferar. Singulariteten är alltjämt långt borta.
Uppladdningsfilter är lika trubbiga verktyg som annonsalgoritmer. En video kan stoppas om en låt spelas på en högtalare i bakgrunden, eller om en person i bild bär en tröja med en upphovsrättsskyddad bild på. Det här är inte några hypotetiska scenarion. Det finns gott om dumma exempel på hur Youtubes upphovsrättsfilter Content ID som infördes 2009 schabblat bort sig. En personlig favorit från 2012 är en video som stoppades på grund av att fågelsång i bakgrunden påminde om ett upphovsrättsskyddat verk.
Men framförallt blir filtren problematiska när vi kommer till upphovsrättens undantag. Legitima skäl att använda upphovsrättsskyddat material är bland annat satir, memes, kritik och parodier. Företeelser som väl är närmast synonyma med internetkultur, och är nästintill omöjliga för algoritmerna att upptäcka på ett träffsäkert sätt.
Felmarginalen kan få enorma konsekvenser
Eftersom filter är notoriskt korkade finns förstås också en felmarginal. Att algoritmerna helt enkelt tycker att en bild är lite för likt ett albumomslag. Att en musikslinga påminner lite för mycket om en hitlåt. Att några bildsekvenser ur en video känns som hämtade ur en Netflix-serie. Den andra sidan myntet är att de dessutom ofta missar att identifiera material som verkligen är upphovsrättsintrång.
Med tanke på den sanslösa mängden innehåll som varje dag laddas upp på de största plattformarna som Facebook, Twitter, Youtube, Snapchat och Instagram skulle även minimala felmarginaler på någon tiondels procent innebära att miljontals fullt legitima skapelser stoppades på daglig basis.
Direktivets förespråkare hugger förstås ifrån här också. Den som fått sitt roliga bildmontage stoppat kan ju bara höra av sig till Google, Facebook eller Twitter och be att få beslutet omprövat av en mer mänsklig intelligens.
Visst har de här jätteföretagen råd att anställa folk att svara på alla klagomålen, men attitydförändringen är det som i kritikernas ord riskerar att ”döda internet som vi känner det”. I dag fungerar merparten av nätet tvärtom. Du laddar upp ditt innehåll, och bryter det mot reglerna kan ditt material anmälas och raderas.
Skjut först och fråga sen
Uppladdningsfiltren fungerar enligt principen skjut först och fråga sen. Det är att skyffla ansvaret från nätjättar och upphovsrättsorganisationer till enskilda användare vars uttryck blockeras. Det är du och jag som får se till att vårt material släpps igenom.
Youtube, Facebook och många andra plattformar har redan filter. De blir bättre dag för dag, men är fortfarande undermåliga, och med en skarpt formulerad Artikel 13 kommer de att finnas på fler tjänster och blockera mer innehåll än någonsin förr.
Sedan ska det sägas att det finns filter som fyller en funktion. Alla större plattformar använder liknande filter för att filtrera bort bilder på sexuella övergrepp av barn. Och visst har även dessa filter säkert stoppat legitimt material. Men är vi redo att göra samma undantag för att stoppa olaglig spridning av Lasse Åbergs Musse Pigg-teckningar som vi gör för att hindra barnpornografi?
Eller hoppas EU på att ai-forskningen gör mirakulösa framsteg innan direktivet träder i kraft? Det är något att fundera över medan du lär dina grafikkort att skilja hundar från katter.