Historisk vinst i Go för datorprogram

2016-03-15 10:09 Torill Kornfeldt  
Go-mästaren Lee Sedol och datorprogrammet AlphaGo möttes.

Det slutade med 4-1 till programmet AlphaGo efter fem matcher mot Gomästaren Lee Sedol. Det innebär inte bara att datorer excellerar i ytterligare ett spel utan visar hur dessa program kommer att påverka vår vardag.

Det blev en intensiv sista match mellan Go-mästaren Lee Sedol och datorprogrammet AlphaGo, utvecklat av googleföretaget Deep mind. Efter fem timmars spel vann till slut AlphaGo i en väldigt jämn match. Programmet hade redan vunnit de tre första matcherna därmed avgjort tävlingen, men Lee återhämtade sig och vann den fjärde matchen.

Go spelas på ett bräde med nitton gången nitton linjer. Spelarna placerar vita eller svarta stenar på linjernas brytpunkter, sammanlagt 361 stycken. Målet är att ringa in den andra spelarens stenar. Spelet kommer ursprungligen från Kina och har spelats under 2500 år.

Mikael Kågebäck forskar kring maskininlärning på Chalmers och är vare sig förvånad över att AlphaGo vann tävlingen eller att Lee Sedol lyckades vinna en match. Det är ett mycket svårt spel och det har varit jämna matcher, berättar han.

Det kan verka trivialt att datorprogram har blivit bättre än människor på ytterligare ett spel, nästan tjugo år efter att Garry Kasparov förlorade i schack mot Deep Blue. Skillnaden är att Go är ett spel om har mycket fler möjliga drag än schack. På grund av det spelar skickliga Gospelare mer med intuition och kan inte alltid förklara logiken bakom varje drag. Den stora komplexiteten har också gjort spelet notoriskt svårt för datorprogram att bemästra.

Här ligger också den stora skillnaden mellan AlphaGo och många program som vunnit över människor i andra spel. I grunden är AlphaGo samma typ av program som i dag används för att till exempel känna igen bilder. Det är program som lär sig saker, snarare än att ständigt referera till en intern databas av information.

Det är talande att en av programmerarna bakom AlpahGo, David Silver, inte själv är någon skicklig Gospelare men har lyckats skapa ett program som nu slår mästare.

I ett första steg så har AlphaGo fått studera hundratusentals Gomatcher för att lära sig formulera regler utifrån dem, på ungefär samma sätt som en människa som lär sig ett spel. Det här står för den första delen av alphaGos strategi, något som skulle kunna kallas intuition, berättar Mikael Kågebäck. Med den här metoden skulle spelet som bäst kunna apa efter mänskliga spelare.

I nästa steg så har AlphaGo fått spela mot sig själv om och om igen och utvecklat nya strategier för att vinna. Det här steget är svårt, utan input utifrån kan programmet råka utvecklas i en riktning som till slut blir rent nonsens.

Mikael Kågebäck jämför det med om två spelare skulle sitta instängda i ett rum och spela mot varandra om och om igen. Efter ett tag skulle de bli väldigt bra på att utnyttja varandras svagheter och de skulle utveckla specialiserade sätt att spela. Om de sen skulle spela om någon annan är det möjligt att de strategierna skulle vara värdelösa eller absurda. Det problemet har Deepmind lyckats undvika i AlphaGo.

Eftersom programmet har spelat mot sig själv och utvecklat egna strategier kan det också göra drag som en människa inte skulle komma att tänka på, drag som inte fanns bland de hundratusentals spel mellan människor som programmet först studerade. Det är här som den andra biten kommer in, det som skulle kunna kallas kreativitet.

Resultatet blev den historiska vinsten mot Lee Sedol, men de verkliga konsekvenserna kommer att märkas i våra liv även om vi inte är Gospelare.

Algoritmen som ligger till grund för AlphaGo är inte specialicerad på Go utan skulle kunna användas till en mängd olika saker. Det är den här typen av program som gör att bildsökningen i Google blir ständigt bättre, att Siri i Iphonen hela tiden blir lite smartare, att datorer bli bättre på att tolka mänskligt tal och så vidare. Mycket snart spås den här typen av program också bemästra översättningar mellan olika språk och hjälpa självkörande bilar att bli säkrare. Vinsten mot Lee Sedol är bara ytterligare ett exempel på hur program kan ta sig an de mest komplexa problem.

Torill Kornfeldt

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

Här är reglerna för kommentarerna på NyTeknik

  Kommentarer

Dagens viktigaste nyheter

Aktuellt inom

Senaste inom

Debatt