Logo von heise online

Suche
Abonnieren

Tägliche Top-News bei WhatsApp, Facebook Messenger, Telegram & Insta

preisvergleich_weiss

Recherche in 1.508.171 Produkten

Harald Bögeholz 203

Künstliche Intelligenz: AlphaZero meistert Schach, Shogi und Go

Künstliche Intelligenz: AlphaZero meistert Schach, Shogi und Go

Bild: Pixabay

Googles KI-Firma DeepMind hat einen selbstlernenden Algorithmus entwickelt, der Schach und Shogi nur anhand der Regeln gelernt hat und nach nur wenigen Stunden die stärksten Programme schlagen konnte.

Die Google-Tochter DeepMind hat mit "AlphaZero" einen Algorithmus entwickelt, der selbstständig die Strategiespiele Schach, Shogi und Go lernt. Und nicht nur das: Die resultierende "Künstliche Intelligenz" (KI) spielt das jeweilige Spiel besser als die stärksten bisherigen Programme (Schach: Stockfish; Shogi: Elmo, Go: AlphaGo Zero 3-day). Bemerkenswert ist vor allem, dass für diese drei unterschiedlichen Strategiespiele im Prinzip ein und dasselbe Verfahren angewendet wird. Grundlage ist wie schon bei der ebenfalls von DeepMind geschaffenen KI AlphaGo ein neuronales Netz.

Anzeige

Bei dem komplexen Strategiespiel Go war es eine Sensation, dass AlphaGo erst den Top-Profi Lee Sedol 4:1 schlug, in einer stärkeren Version 2017 die Nummer eins der Weltrangliste Ke Jie 3:0 wegputzte und dann in einer nochmals verbesserten Version namens AlphaGo Zero das Spiel von Grund auf selbst gelernt hatte und seinen Vorgänger auf die Plätze verwies.

Obwohl AlphaGo Zero laut DeepMind "ohne menschliches Wissen" über Go auskommt – also nicht mit Partien menschlicher Top-Spieler trainiert wurde – war es vor allem in der Architektur der neuronalen Netze sehr stark auf Go zugeschnitten. Die Fachwelt war daher skeptisch, ob das Verfahren auch auf andere Strategiespiele wie Schach übertragbar ist.

Es ist: In dem jüngst auf arXiv veröffentlichten Forschungspapier "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm" stellt das DeepMind-Team rund um David Silver das Programm AlphaZero vor, das alle drei Spiele binnen kurzer Zeit selbst gelernt hat – und das nur anhand der Regeln und durch Spielen gegen sich selbst.

Wenn das Google-Team schreibt, das Programm habe die Spiele innerhalb von 24 Stunden gelernt, muss man das in Relation zum betriebenen Aufwand sehen: Ganz beiläufig ist in dem Paper erwähnt, dass 5000 Tensor Processing Units (TPU) der ersten Generation und 64 TPUs der zweiten Generation zum Einsatz kamen. TPUs sind Spezialchips für Berechnungen in neuronalen Netzen. Die erwähnte erste Generation leistet 92 Tera-Operationen pro Sekunde; über die zweite weiß man nichts Genaues.

Aber gut: Das fertig trainierte neuronale Netz spielt das Spiel dann auf einer einzelnen Maschine mit nur vier TPUs, was ein halbwegs fairer Vergleich mit den jeweils stärksten Schach- und Shogi-Programmen ist, die immerhin 64 CPU-Kerne zur Verfügung hatten.

Laut DeepMind schlug das fertig trainierte AlphaZero unter Turnierbedingungen (eine Minute pro Zug) in jeder der drei Disziplinen das jeweils stärkste bisherige Programm überzeugend. Im Schach war dies das Open-Source-Programm Stockfish, Sieger des Top Chess Engine Championship (TCEC) 2016, im Shogi Elmo, Sieger des 27th World Computer Shogi Championship. Im Go war der Gegner AlphaGo Zero aus dem eigenen Hause.

Ganz ohne menschliche Hilfe kam aber auch AlphaZero nicht aus: Es ist mitnichten so, dass hier ein Roboter namens AlphaZero seine Kamera auf ein Spielbrett richtet und alles selbst herausfindet. In der Kodierung der Spielposition und der möglichen Züge in Eingabe-Features neuronaler Netze steckt durchaus einiges menschliches Fachwissen, ebenso in der Kodierung der Ausgabe.

Anzeige

Aber es ist vergleichsweise wenig. Und so dürfte es Schach-Kenner faszinieren, dass AlphaZero die populärsten von Menschen gespielten Eröffnungen allesamt entdeckt hat (siehe das DeepMind-Paper) – und einige davon am Ende verworfen hat. (Harald Bögeholz) / (bo)

203 Kommentare

Themen:

Anzeige
  1. Künstliche Intelligenz: AlphaGo Zero übertrumpft AlphaGo ohne menschliches Vorwissen

    Künstliche Intelligenz: AlphaGo Zero übertrumpft AlphaGo ohne menschliches Vorwissen

    Im asiatischen Strategiespiel Go hat das Programm AlphaGo der Google-Tochter DeepMind in diesem Jahr den stärksten menschlichen Profispieler besiegt. Eine neue Version hat das Spiel jetzt ohne menschliches Vorwissen gelernt und spielt noch stärker.

  2. Go-Weltmeisterschaft in Osaka: Korea gewinnt, Computer wird Dritter

    Go-Weltmeisterschaft

    Die dreitägige Weltmeisterschaft im Strategiespiel Go zwischen den drei Go-Nationen und einer künstlichen Intelligenz ist vorüber. Korea gewinnt vor China, Japan verliert und das Go-Programm DeepZenGo erringt mit dem dritten Platz einen Achtungserfolg.

  3. Künstliche Intelligenz: AlphaGo spielt Go gegen Top-Profi Ke Jie

    Future of Go Summit

    Auf dem "The Future of Go Summit" trifft AlphaGo auf den Weltranglisten-Ersten im Go. Hier geht es nicht mehr um den letzten Showdown zwischen Mensch und Maschine, sondern darum, was Go-Profis von der künstlichen Intelligenz lernen können.

  4. Künstliche Intelligenz: AlphaGo besiegt Ke Jie zum dritten Mal

    Künstliche Intelligenz: AlphaGo besiegt Ke Jie zum dritten Mal

    Man hat es schon geahnt, aber jetzt ist es Gewissheit: Der Weltranglisten-Erste im asiatischen Strategiespiel Go musste sich zum dritten Mal der künstlichen Intelligenz geschlagen geben.

  1. Lernen in virtuellen Welten

    Lernen in virtuellen Welten

    Damit ein System mit künstlicher Intelligenz gesprochene Anweisungen ausführen kann, muss es sie erst einmal verstehen. Zwei Forschergruppen schicken sie dazu in ein virtuelles Trainingscamp.

  2. Künstliche Intelligenz: Wen es zuerst trifft

    Künstliche Intelligenz: Wen es zuerst trifft

    Früher oder später soll Künstliche Intelligenz bei fast allen Tätigkeiten besser sein als Menschen. Für eine Studie haben Experten jetzt konkrete Daten für verschiedene Aufgaben prognostiziert – die aber zum Teil schon überholt sind.

  3. Dumme KI

    Die Künstliche Intelligenz "Tay" von Microsoft setzte rassistische und sexistische Kommentare in die Welt - und zeigt die Grenzen der Technik

  1. Kryptowährung: Apple lässt gefälschte Wallet-App in App Store

    Kryptowährung: Apple lässt gefälschte Wallet-App in App Store

    Im Hype um Kryptowährungen hat die für über 5 Euro gehandelte iPhone-App “MyEtherWallet” offenbar zahlreiche Kunden gefunden – allerdings steckt dahinter nicht der tatsächliche Anbieter der gleichnamigen Ethereum-Wallet.

  2. Android 8.1 zeigt Geschwindigkeit öffentlicher Netzwerke an

    Android 8.1 zeigt Geschwindigkeit öffentlicher Netzwerke an

    Android zeigt ab Version 8.1 nicht mehr nur die Signalstärke WLANs an, sondern auch die erwartete Surfgeschwindigkeit in vier Stufen. Die Neuerung funktioniert nur bei öffentlichen Netzwerken.

  3. Trump und die Forschung: Medizin-Nobelpreisträger kritisiert US-Regierung

    Trump und die Forschung: Medizin-Nobelpreisträger kritisiert US-Regierung

    Der Nobelpreisträger Michael Rosbash nutzte seine Dankesrede auf dem Nobelbankett in Stockholm dazu, vor Beschränkungen der Wissenschaft zu warnen. Dabei kritisierte er indirekt US-Präsident Donald Trump.

  4. Mercedes-Maybach 6 Cabriolet

    Mercedes-Maybach 6 Cabriolet

    Die Leistungsschau der Marke Mercedes-Maybach war auf dem Pebble Beach Concours D’Élégance in Monterey zu sehen. Das Mercedes-Maybach 6 Cabriolet zeigt, was passiert, wenn die Schwaben all das, was sie können, auch wirklich sollen

Anzeige