Datorsekreteraren fattar inte ett dyft

2011-04-05 06:00 Mats Lewan  
Dikteringsprogrammet Dragon Dictation förstår inte svenska och har svårt att hänga med i ett vanligt samtal. Foto: Jörgen Appelgren

Att förstå vanligt prat kan tyckas enkelt, men för datorer är det fortfarande svårt. När Ny Teknik testade verktyg för diktering, på datorn och i mobilen, blev resultatet klent.

<p>Med drömmen om att kunna få telefonintervjuer utskrivna av datorn provade vi det kanske mest använda dikteringsprogrammet i världen, Dragon Naturally Speaking från Nuance. Men vår dröm gick i kras.</p> <p>För det första finns programmet fortfarande inte för svenskt tal, så vi fick nöja oss med engelska och italienska versioner. </p> <p>Bäst klarade programmet uppläsning av text och prickade då ofta rätt i minsta detalj. Men så fort vi började prata fritt sjönk träffsäkerheten kraftigt med flera helt felaktiga ord per mening.</p> <p>Vi lät sedan programmet ge sig på en inspelad telefonintervju, vilket görs genom att låta det analysera en ljudfil. Analysen tog omkring dubbelt så lång tid som ljudfilens verkliga längd, men trots det kom utskriften inte i närheten av det verkliga innehållet. Ren rappakalja kort sagt.</p> <p>Upplevelsen blir inte bättre av att programmet är ganska rörigt i menyer och inställningar, ibland hänger sig under uppstart och stökar till på skärmen med fasta lister och fönster. Det går inte att ha två olika språk installerade samtidigt, och både installation och avinstallation tar upp emot tio minuter.</p> <p>Sammantaget gör det att nuvarande storanvändare - läkare och jurister samt i viss mån handikappade - troligen fortsätter att vara de viktigaste användarna. För just läkare och jurister finns dessutom specialutgåvor med stöd för specialtermer.</p> <p>Närmare till hands för vanliga användare är Dragons dikteringsapp för Iphone - Dragon Dictation - som är gratis, men ännu inte finns tillgänglig på svenska App Store.</p> <p>Liksom på datorn fungerar appen bäst vid uppläsning av text och kräver annars korta och helt korrekta fraser. Resultatet visas på skärmen och kan skickas med mejl eller sms, kopieras eller läggas upp på Twitter eller Facebook.</p> <p>Appen klarar i dag engelska, tyska, franska, italienska, japanska och kinesiska, men enligt Nuance är stöd för svenska på gång, eventuellt under året.</p>

Därför fungerar det så dåligt

  • Att det är så besvärligt för en dator att skriva ut vad en röst säger beror i grund och botten på att den inte förstår vad som sägs.
     
  • Dessutom kan inte datorn skilja på två röster, eller ens mellan röst och bakgrundsbuller. Hur lång tid det tar innan datorer klarar röstförståelse obehindrat är därför svårt att säga.
     
  • Dagens program bygger på statistisk analys av språkljud - den mest sannolika frasen räknas ut. Men för full röstförståelse krävs även ett element av artificiell intelligens.

Mats Lewan

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

Här är reglerna för kommentarerna på NyTeknik

  Kommentarer

Dagens viktigaste nyheter

Aktuellt inom

Senaste inom

Debatt