Lyssna på Googles nya ai-röst: människa eller maskin?

2017-12-27 12:39  
Foto: Lorenzo Tlacaelel / CC BY 2.0

Googles nya talsyntes-system Tacotron 2 ska göra det omöjligt att särskilja digitala assistenter från mänskliga röster, hävdar sökjätten.

Tycker du att Googles digitala assistent låter stel och styltig?

Vänta bara - inom kort kommer det att svårt att veta om det är en människa eller maskin som du lyssnar på.

Det hävdar i alla fall Google.

Sökjätten publicerade nyligen de första exemplen som visar vad andra generationen av dess talsyntes-system klarar av. Lyssna på dem här!

Systemet Tacotron 2 består av två artificiella djupa neurala nätverk. Det första gör en analys för att översätta text till ett spektogram, som är en visuell representation av ljud i form av graf.

Spektogrammet skickas vidare till det andra neurala nätverket, där ai-systemet Wavenet analyserar grafen och skapar röstljud utifrån den.

Talsyntes-system har ofta svårt att återge skiljetecken i skriven text. Men enligt Google kan Tacotron 2 förändra uttalet om det exempelvis finns kommatecken med i en mening.

Ai-systemet har också tränats att betona ord som skrivs med versaler. På så sätt kan Tacotron 2 härma hur en människa låter för att lägga mer tyngd vid vissa ord.

Men trots att systemet har gjorts mer avancerat kan det än så länge bara imitera en enda kvinnlig röst. För att det ska kunna tala med en annans kvinnas stämma - eller en mans - behövs mer träning, skriver Quartz.

Kalle Wiklund

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

Här är reglerna för kommentarerna på NyTeknik

  Kommentarer

Dagens viktigaste nyheter

Aktuellt inom

Debatt