Sverige får Wikipedia att börja prata

2016-03-14 11:29 Ulla Karlsson-Ottosson  

Wikipedia ska börja prata på svenska, engelska och arabiska. Wikipedia Sverige driver det unika projektet Wikispeech.

Upp till 25 procent av de som använder det fria uppslagsverket Wikipedia skulle föredra att ta till sig information i uppläst form. Omvandlat till antal användare handlar det om 125 miljoner användare i månaden. För att tillfredställa det behovet startar nu projektet Wikispeech. Med hjälp av talsyntes ska artiklarna i Wikipedia kunna läsas upp på engelska, svenska samt i viss mån arabiska. Projektet drivs av Wikimedia Sverige.

–Jag har tidigare arbetat med personer som har funktionsnedsättningar och har gått och grunnat länge på vad man kan göra för att göra informationen på Wikipedia ännu mer lättillgänglig, säger John Andersson, projektledare på Wikimedia Sverige.

För ett år sedan började han söka han pengar hos Post- och Telestyrelsen för projektet. Efter en förstudie hösten 2015 går nu startskotten i morgon, tisdag den 15 mars. Och det kommer att gå undan. Senare i år ska de som vill kunna testa den nya funktionen via en specialserver. Under 2017 ska möjligheten att få texten uppläst med en syntetisk röst vara implementerad på Wikimedias servrar

–Tanken är att sätta ihop de delar inom talsyntes som finns som öppen programvara och sedan vässa resultatet med hjälp av forskning på KTH och Södermalms talteknologiservice.

Talsyntesen kommer att bli ett tillägg till den plattform som Wikipedia använder, MediaWiki. Skriven i öppen källkod blir den fri att använda och utveckla vidare av andra.

Svenska, engelska och till viss mån arabiska blir de första språken.

– Nu lägger vi grunden. På sikt hoppas vi att alla 292 språk som finns i Wikipedia ska kunna omfattas, säger John Andersson.

Tanken är att användarna själva ska bidra, inte minst genom att markera när uttalet inte är som det ska.

– Precis som med allt annat innehåll på Wikipedia kan alla hjälpa till att förbättra talsyntesen så att den över tid låter mer och mer naturlig. Den som kan skriva fonetiskt text kan naturligtvis ändra det direkt.

Behovet av uppläst text är extra stort i länder där analfabetism är vanlig.

– När ebolakrisen var som värst var Wikipedia den främsta källan till medicinsk information som var lätt att ta till sig. Den hade kunnat nå ännu fler i fall det som stod där hade gått att lyssna på i stället för att läsa, konstaterar John Andersson.

Utvecklingen av talsyntesen Wikispeech finansieras av Post- och Telestyrelsen som går in med 2,8 miljoner kronor. KTH bidrar med ytterligare en miljon kronor. Forskningsprojektet pågår fram till september 2017.

 

Gilla Ny Teknik på Facebook

Ulla Karlsson-Ottosson

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

Här är reglerna för kommentarerna på NyTeknik

  Kommentarer

Dagens viktigaste nyheter

Aktuellt inom

Senaste inom

vill du synas här? annonsera

Debatt