Ai-assistenter har nått ”mänsklig nivå”

2016-12-13 10:52  
Den digitala assistenten Amelia ska börja användas av svenska banken SEB för kundtjänst. Amelia har ett rörligt ansikte på en skärm, baserad på artificiell intelligens. Systemet är utvecklat av det amerikanska företaget IP Soft, där Ergun Ekici arbetar. Foto: Jörgen Appelgren

Att föra en normal konversation med en ai känns fortfarande inte naturligt. Om experterna har rätt, kommer det snart att bli ändring på det.

En av de första prototyperna till skrivmaskinen konstruerades i Italien på 1500-talet. Då hade människan redan använt den underliggande tekniken – att spara kommunikation i form av nedskriven text – i flera tusen år. I dag är pennan och tangentbordet så självklara tekniska hjälpmedel att vi inte ens tänker på dem som sådana.

Men inom kort kommer de att möta motstånd från ett biologiskt verktyg som är lika gammalt som människan själv: rösten. Tecknen finns. Häromåret demonstrerade den kinesiska sökmotorjätten Baidu att deras ”deep learning”-system – Deep Speech 2 – i vissa fall förstod engelska och mandarin bättre än människor.

Några forskare vid Stanford använde samma system för att jämföra röst-till-text med inmatning från ett tangentbord. Deep Speech var tre gånger snabbare.

I oktober visade några forskare på Microsoft ett liknande resultat, testat på sin egenutvecklade ”deep learning”-mjukvara, Cognitive Toolkit.

– Vi har nått mänsklig nivå. Det är ett historiskt framsteg, sa Xuedong Huang, en av Microsoft-forskarna.

Läs mer:

Läs mer: Artificiell intelligens formar framtiden

I slutet av november upptäckte Googles översättningsdivision något egendomligt. De hade precis börjat använda ”deep learning” för att förbättra sin tjänst när de insåg att systemet kunde översätta mellan två språk som systemet aldrig tidigare hade sett.

Enligt vad Google erfar skapar deras djupa neurala nätverk en språklig modell – ett sorts hjälpspråk – för att hitta gemensamma nämnare. ”Det betyder att nätverket måste tolka något i semantiken i en mening snarare än att bara memorera fras till fras-översättningar. Vi tolkar det som ett tecken på att det existerar ett interlingua i nätverket”, skrev en av forskarna på Googles blogg.

Enligt Stefan Carlsson, professor i datavetenskap vid KTH, råder det ingen tvekan om vad detta kommer att leda fram till.

– Man kommer att kunna ställa frågor helt naturligt och konversera med intelligenta artificiella assistenter. Inom ganska kort tid kommer du att kunna prata med programvara utan att veta om det är en människa eller ett program.

I dag är det ingen som skulle påstå att virtuella assistenter som Siri, Cortana, Alexa eller Googles assistent passerar Turing-testet, men utvecklingen går snabbt framåt på området. Många bedömare såg Googles nya Pixel-telefon som ett sätt för sökjätten att prioritera röst framför touch: Dess virtuella assistent har fått en mer framskjuten roll hos Pixel.

Läs mer:

Läs mer: Har du de här jobben får du se upp för AI

En utmanare är Viv Labs, grundat av Dag Kittlaus and Adam Cheyer som en gång ledde arbetet med att utveckla Apples Siri. I dag kallar de Siri ”en kompetent chatbot”, medan Viv ska ses som ”portalen till internet”. Första gången de testade Viv i skarpt läge bad de henne beställa mat på den lokala pizzerian. En stund senare levererades maten (med rätt tillbehör) utan att utvecklarteamet använt vare sig telefon, tangentbord, eller tryckskärm.

Samsung köpte Viv Labs i oktober, med villkoret att företaget skulle få förbli oberoende och finnas till fler prylar än Samsungs egna. ”Snart kommer vi alla att ha en trogen assistent som en naturlig del av vår vardag. Denna assistent kommer att vara lika självklar som webbläsaren eller mobilappen”, skrev Kitt–laus i samband med Samsung- affären.

”Deep learning”-algoritmernas förmåga att förstå språk kan inte bara förbättra kommunikationen mellan människor och maskiner, utan också mellan människor som inte talar samma språk.

– En svensk operatör på ett pappersbruk uppe i Örnsköldsvik ska kunna tala med en kille i Peru, med hjälp av Watson. De talar sina egna språk och svaren kommer på deras egna språk. Det kommer att finnas lösningar för det under första kvartalet 2017, säger Pierre Sundgren, internet of things-expert på IBM.

Virtuella assistenter som förstår vad du säger

Artificial Solutions. Ett svenskt bolag som ligger långt framme vad gäller ai och språkförståelse.

Amelia. Ipsofts kognitiva assistent som just nu testas av svenska banken SEB.

Mindmeld. Har just lanserat det de kallar ”världens mest avancerade plattform för ai-konversation”.

Ozlo. Lär känna sin användare. Har precis släppts till Ios, men än så länge inte i Sverige.

Peter Ottsjö

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

Här är reglerna för kommentarerna på NyTeknik

  Kommentarer

Aktuellt inom

Debatt

COMSOL