Bild nicht mehr verfügbar.

Nach vier Stunden Training verlor AlphaZero kein einziges Spiel gegen Stockfish 8.

Foto: Reuters

Mit dem komplexen Brettspiel "Go" hat der Computer 2015 eine wichtige Hürde gemeistert. Mit dem Sieg über einen Profispieler und in weiterer Folge über mehrere Spieler aus der Weltspitze konnte Googles künstliche Intelligenz "AlphaGo" einen neuen Meilenstein in ihrem Entwicklungsfeld verbuchen.

Nun ist ein neues Kunststück gelungen. Nachdem 1997 erstmals eine Software einen Schachweltmeister schlagen konnte (Deep Blue vs. Gari Kasparow), brachte sich nun AlphaGo selber fortgeschrittene Strategien des Spieles bei und zeigte dem stärksten Schachprogramm seine Grenzen auf.

Vier Stunden gelernt, kein Spiel verloren

"AlphaZero" nennt sich der selbstlernende Algorithmus, der von Google speziell für Spiele entwickelt wurde. Er startete nur mit Basiswissen über die Regeln des Schach in die Vorbereitung für das Duell mit Stockfish 8. Das quelloffene Stockfish gilt laut CCRL-Ranking als aktuell stärkste Schach-Engine. Sie baut auf starre Einprogrammierung des Regelwerks und Vorberechnung von Zügen auf Basis einer Datenbank aller möglichen Abfolgen.

Googles digitaler Spieler erhielt vor dem ersten der insgesamt 100 Duelle vier Stunden Zeit, um in Spielen gegen sich selbst die Feinheiten des "Spiels der Könige" zu erlernen. Anschließend soll es alle Partien gewonnen oder mit einem Remis beendet haben, zitiert der Guardian aus einem an der Cornell University veröffentlichten Paper (PDF), das noch einem Peer Review unterzogen werden muss.

Konkret konnte Alphazero 25 der Spiele gewinnen, in welchen es in Weiß spielte und somit den Vorteil des ersten Zuges genoss, die anderen 25 endeten als Remis. Startend auf Schwarz gelangen drei Siege und 47 Unentschieden.

Auch "Alphago" geschlagen

Das Experiment wurde mit dem Spiel "Shogi", einem japanischen, dem Schach nicht unähnlichen Brettspiel, wiederholt. Hier konnte die KI 90 von 100 Partien gegen das beste Computerprogramm Elmo gewinnen. Acht gingen verloren, zwei endeten mit einem Remis.

Beachtlich ist auch ein Erfolg gegen sich selbst. Nach acht Stunden Training in "Go" schlug Alphazero seien Quasi-Vorgänger Alphago in 60 von 100 Spielen. (red, 08.12.2017)

Update, 15:40 Uhr: Im ersten Absatz war irrtümlich vermerkt, AlphaZero hätte sich die Regeln von Schach selber beigebracht, was unrichtig ist und dem restlichen Text widerspricht. Diese Passage wurde korrigiert.