Nieuwe mijlpaal in artificiële intelligentie: computer verslaat mens bij complex bordspel

Met de AlphaGo ontwikkelt Google de eerste computer die intuïtief kan spelen

kos
Dat we het in een partijtje schaak al lang niet meer van een computer kunnen halen, wisten we al. Nu blijkt een computer ook 'slimmer' te zijn dan het menselijk brein wanneer het gaat om een spelletje GO. Dat is opmerkelijk omdat het Chinese bordspel oneindig veel complexer is dan bijvoorbeeld schaken. De overwinning betekent dan ook een nieuwe grote stap in het veld van de artificiële intelligentie.

Door de jaren heen werden computers ingewikkelde puzzels waarvan we aanvankelijk dachten dat ze alleen door het menselijke brein opgelost konden worden, steeds beter meester. In 1997 versloeg de supercomputer van IBM Deep Blue grootmeester Garry Kasparov bij een partijtje schaak en in 2011 gaf IBM's Watson alle voorgaande winnaars van de quiz Jeopardy het nakijken. Dit jaar werd op gebied van artificiële intelligentie echter een nieuwe kaap gerond: een computer is erin geslaagd de mens te verslaan in het spel GO. Die prestatie is zo bijzonder omdat het Chinese bordspel oneindig veel complexer is dan eender welk ander bordspel.

Het aloude Chinese GO wordt gespeeld op een bord waarop 19 x 19 lijnen samen een raster met 316 'kruispunten' vormen. De bedoeling van het spel is dat beide spelers met hun stenen (de ene wit, de andere zwart) zoveel mogelijk hokjes veroveren door ze te omsingelen. Hoewel de regels van GO op zich niet zo ingewikkeld zijn, is het spelverloop dat zeker wel: bij elke zet zijn er zo'n 200 verschillende opties mogelijk. Bij schaak zijn er dat maar om en bij de 20. Die ruime keuzemogelijkheid maakt het voor een computer bijzonder moeilijk om het spel onder de knie te krijgen.

Menselijk denken

"Bij een spelletje schaak volstaat het voor een computer om de gevolgen van elke mogelijke stap uit te denken en vervolgens de meest efficiënte weg naar winst te kiezen", zegt Demis Hassabis, CEO van Google DeepMind aan Quartz. "Bij Go is dat echter onmogelijk, er zijn immers meer mogelijkheden dan dat er atomen zijn in het heelal." Om een computer te bouwen die op een professionele manier Go kan spelen, moest men dus een systeem ontwikkelen dat het denkvermogen van een mens nabootst. Dat is dan ook precies wat de onderzoekers van DeepMind deden.

'Bij GO kan een computer niet simpelweg de best mogelijke stappen uit het totaal selecteren, de opties zijn immers eindeloos'

Demis Hassabis, CEO van Google DeepMind

Voor hun design bouwde het team twee neurale computernetwerken die 'getraind' kunnen worden door grote hoeveelheden data in te voeren. Die data kan de computer vervolgens actief gebruiken om problemen op te lossen. "We hebben AlphaGo een analyse laten maken van 30 miljoen zetten van Go-partijen tussen professionele spelers", zegt Hassabis. "Op die manier leerde de computer welke zetten vaak gemaakt worden, en welk resultaat die opleveren in het vervolg van het spel." Aan de hand van die opgedane kennis speelde de computer vervolgens miljoenen spelen tegen zichzelf. Daardoor kon hij leren uit zijn eigen fouten en het spel zodanig onder de knie krijgen dat hij zijn stappen voortaan ook vooruit kon plannen.

quora.com

Intuïtie

Erg bijzonder aan de neurale netwerken is, dat ze de computer toelaten te opereren op basis van zijn 'intuïtie': in plaats van alle mogelijke moves uit te denken, maakt het systeem uit een oneindig aantal mogelijkheden een selectie van twee of drie stappen, waarvan het 'aanvoelt' dat deze de beste opties zijn. Net zoals ook topspelers van Go moeten afgaan op hun buikgevoel om een spel te winnen.

Dat de AlphaGo zijn naam niet gestolen heeft, mag duidelijk zijn: vorig jaar in oktober versloeg de computer de Europese Go-kampioen met forfaitcijfers. De resultaten van die match werden nu pas naar buiten gebracht om ze te laten samenvallen met de publicatie rond de software in het vakblad Nature. Daarnaast lieten de onderzoekers van Deep Mind hun 'slimme speler' het ook opnemen tegen andere GO-spelende computersystemen. Van die partijen won AlphaGO er 99,8 procent.

De nieuwe Google-computer lijkt alvast één groot streepje voor te hebben op de mens: "Terwijl mensen onvermijdelijk bepaalde zwakheden hebben - ze worden moe wanneer ze lang spelen of kunnen fouten maken - heeft ons systeem daar geen last van", zegt Hassabis. "Sterker nog: hoe meer het speelt, hoe sterker het zal worden." De ontwikkeling van de AlphaGo lijkt dan ook een nieuwe mijlpaal te zijn in de ontwikkeling van artificiële intelligentie: de computer ondersteunt de idee dat echt, doelgericht 'denkwerk' door technische computersystemen wel degelijk mogelijk is.

'Net zoals ook topspelers van Go moeten afgaan op hun buikgevoel om een spel te winnen, zal de computer aanvoelen welke zet de beste is'

Demis Hassabis, CEO van Google DeepMind