Dagen da et nevralt nettverk slo tung prosessorkraft ned i støvlene

Tekst: Morten Iversen

– Hadde neppe trodd det var mulig om jeg ikke så det med egne øyne

Dette sier treneren til verdensmesteren i sjakk, Peter Heine Nielsen. Som fram til introduksjonen av det nevrale nettverket AlphaZero hadde lurt på hvordan det ville se ut dersom et overlegent vesen hadde landet på jorda og vist oss hvordan sjakk skal spilles.

Morgenen den 5. desember 2017 satt GM Peter Heine Nielsen og gjorde sine strategiske analyser og forberedelser fram mot Magnus Carlsens match mot Wesley So i London Chess Classic. Ulike nyheter, temaer, trekk og ideer  ble matet inn i sjakkmotoren StockFish. Det foretrukne analyseredskapet for Heine Nielsen og en samlet sjakkelite. Et program spillemessig overlegent verdensmesteren sjøl og alle andre programmer. En motor som med tilgang på nok prosessorkraft kan beregne tett opp mot en milliard trekk i sekundet.

– Du kan jo forestille deg at du sitter der som verdensmesterens mangeårige trener og er hundre prosent trygg på at de verktøyene du bruker er de beste. At sjakkmotoren du har surrende er den fremst kilde til viten i universet. Selve fasiten. Og så blir den fullstendig smadret i løpet fire korte timer. Det var sjokkerende. Det var jo mitt faglige nivå som ble gruset. Så ja. Det var en spesiell dag. Sjokkerende, men også fantastisk. At «noen» skulle komme opp med noe så revolusjonerende hadde vi ikke trodd. Samtidig var det med ærefrykt vi så hvor mye som fortsatt var ubeskrevet og ennå ikke oppdaget av mennesket, sier Heine Nielsen.

Èn til tusen i regnekraft

Andre sjakkprogrammer benytter seg av «alfa-beta-søk» og går gjennom en tilnærmet uendelig mengde sekvenser og vurderer dem etter utviklernes instrukser. Instrukser som igjen bygger på empiri og oppsamlet erfaring. Alphazero på sin side benytter Monte Carlo-baserte søk. En metode fra 1940-tallet som er mye brukt i spillanalyser hvor datamaskinen prøver seg fram til forskjellige løsninger og velger den mest lovende ut fra tidligere erfaring. Erfaringen har AlphaZero skaffet seg gjennom fire timers spill mot seg selv. Fordelen er at desto mer komplekst problemet er, jo mer effektivt blir søket. Alphazero analyserer bare en tusendel av mulighetene som Stockfish raser igjennom, men er allikevel totalt overlegen. Det krever mye å trene et nevralt nettverk, men når det først er der, så kjører det på relativt lett prosessorkraft. Med en intuisjon nesten som et menneske.

– Før hadde vi én fasit. Nå har vi to «autoriteter» å forholde oss til. Den dype menneskelige intuisjonen og regnemaskinens følelsesløse konkretiseringer. Grensene for hva som er mulig i sjakk er med dette blitt kraftig utvidet. Noe som gagner en intuitiv spiller som Magnus mer enn de som er gode på å regne variasjoner, sier Heine Nielsen. 

Den intuitive maskinen

AlphaZero spiller ifølge Heine Nielsen med en høy grad av intuisjon og forstår sjakk på en mer menneskelig måte. At det nevrale nettverket har inspirert verdens ubestridte mester til å angripe friskere, er han ikke i tvil om. Til tross for enorm spillestyrke er Nielsen allikevel av den oppfatning at mennesket har hengt godt med opp til et visst nivå. 

– Flere ganger ble Stockfish slått ved at Alpha Zero ofret materiell til fordel for initiativ og posisjonelle fordeler. Den fant teknikker og ressurser mennesket ennå ikke hadde oppdaget. Dette har uten tvil gitt den noe romantiske angrepssjakken en renessanse. Sjokket mitt er imidlertid lite i forhold til det Go-miljøet fikk da forløperen AlphaGo Zero ga de beste Go-spillerne bank nærmest over natta. Go er et spill som krever en helt annen strategisk forståelse enn sjakk. Beregning av varianter hjelper deg i liten grad. I sjakken var det en naturlig utvikling, men i Go-miljøet var det en bombe som gikk av plutselig. Spillet hadde fram til da vært nærmest håpløst å vinne for en maskin. Mange av oss forsto vel da at vi rett og slett ikke hadde skjønt nevrale nettverk og maskinlæring, og lullet oss inn i en virkelighet der vi så på computere som forvokste kalkulatorer. Slik er det ikke lenger, sier Heine Nielsen. 

Uante muligheter

Men hva gjør man da om man er et «nevralt nettverk» som aldri blir slitent og som har bevist at det kan mestre et 1500 år gammelt spill på et nivå ingen andre har vært i nærheten av. Ja, på et nivå som for den ypperste ekspertisen er vanskelig å henge med på. Etter å ha knust StockFish ga derfor skaperne algoritmen to timer trening i spillet Shogi. Som deretter slo den beste Shogi-computeren Elmo ettertrykkelig. Finnes det egentlig noen grense for hva teknologien kan brukes til? 

– Jeg mener at AlphaZero faktisk representerer en kunstig intelligens. Det blir spennende å se hva et nevralt nettverk som dette vil kunne finne av sammenhenger som ikke har åpenbart seg for oss. Å ha en maskin som er i stand til å overgå århundrer med menneskelige anstrengelser og erfaring, i et komplekst lukket system som sjakk, er rimelig revolusjonerende. Men jeg tror algoritmen – eller en videreføring av den – en vakker dag vil kunne skape noe stort. Noe som kanskje får Nobelprisen. Kanskje i medisin. Kanskje i litteratur. Sånn sett syns jeg det er raust av teamet bak å ta seg tid til å trene den i sjakk. For vi har fått mye ut av de fire timene, avslutter Heine Nielsen.

Aktuelt

Relaterte artikler

LEGG IGJEN EN KOMMENTAR

Vennligst skriv inn din kommentar!
Vennligst skriv inn navnet ditt her