Die Welt von Go ist in einem Schockzustand, wie wir in einem früheren Post berichtet haben. Zum ersten Mal hat ein Computerprogramm einen professionellen Spieler geschlagen. Das Computerprogramm hinter dieser Leistung, AlphaGo, wurde von Google Deep Mind entwickelt und verwendet mehrere hochmoderne Techniken (siehe unseren vorherigen Beitrag für Details). Das Ergebnis war bahnbrechend, denn Go – ein asiatisches Spiel mit viel mehr Möglichkeiten als Schach – wurde als heiliger Gral der KI angesehen. Es wurde angenommen, dass Computer in der Lage sein sollten, Intuition zu zeigen, um auf einer Top-Ebene zu spielen – jetzt scheint es, dass sie es schaffen können.
Die Dinge könnten sich sehr bald für die Menschheit verschlechtern. Vom 9. März bis zum 15. März wird AlphaGo gegen 9-Dan Lee Sedol (Südkorea) spielen, einer der Top-Spieler der Welt. Das Spiel findet in Seoul statt und wird über fünf Spiele mit einem Preisgeld von 1 Million US-Dollar ausgetragen. Wird Lee Sedol die letzte Bastion des menschlichen Stolzes gegen KI verteidigen?
Südkorea ist eines der führenden Länder von Go, wo es eher "baduk" genannt wird als der japanische Name. (Vielleicht sollte AlphaGo für dieses Spiel in AlphaBaduk umbenannt werden). Der 33-jährige Lee Sedol ist zuversichtlich, dass er gewinnen wird, aber die Go-Community ist nicht so sicher.
Auf der positiven Seite ist Lee Sedol viel stärker als Fan Hui, der 2-Dan-Profi und Europameister, der im vergangenen Oktober 0: 5 gegen AlphaGo verlor. Der Unterschied ist ähnlich dem Unterschied zwischen einem Master und einem Top-Grandmaster im Schach. Lee Sedol wird voraussichtlich die meisten Spiele gegen Fan Hui gewinnen.
Auf der negativen Seite, Fan Hui verlor alle Spiele des Spiels, was deutlich zeigt, dass AlphaGo einem 2-Dan-Profi überlegen ist. Es ist auch wahrscheinlich, dass Google Deep Mind eine verbesserte Version verwenden wird. Zum Beispiel hat AlphaGo seit Oktober fünf zusätzliche Monate des Lernens mit mehr Meisterspielen genutzt, um seine Bewertung der Positionen und seiner Bewegungsauswahl zu verbessern. Es könnte auch leistungsfähigere Hardware verwenden und auch eine Eröffnungsdatenbank verwenden, was es im vorherigen Spiel nicht getan hat. Dies würde es ermöglichen, menschliches Wissen in den ersten Zügen zu nutzen und somit minderwertige Öffnungslinien zu vermeiden.
Welche Strategie sollte Lee Sedol annehmen?
Einige mögen abschätzig behaupten, dass die Druckdurchführung "alles in Ihrem Kopf" ist, aber, wie eine neue Studie ergab (Chib, Shimojo, & O'Doherty, 2014), hinterlässt der Druck einen echten neurologischen Fußabdruck, der dazu führt, dass Menschen sich "verschlucken" Fähigkeitsniveau. Sedol wird während des Spiels unter erheblichem psychologischem Druck stehen, angesichts der weltweiten Aufmerksamkeit, die es aufbringen wird. Er scheint selbstsicher zu sein und spricht bereits von einem Rematch, was eine gute Einstellung ist, es sei denn, es wird zu wenig Selbstvertrauen. In seinem Spiel gegen Deep Blue im Jahr 1997 hat Schachweltmeister Gary Kasparov den Druck nicht gut gemeistert und schwere Fehler gemacht (Hsu, 2002). Es gibt verschiedene Techniken, mit denen Sedol sich psychologisch vorbereiten kann. Er kann gegen Computerprogramme spielen, so dass er sich daran gewöhnt, Maschinen zu spielen. Da verfügbare Computerprogramme viel schwächer als AlphaGo sind, sollte er schwierige Positionen auswählen, die er dann gegen den Computer spielen würde; Dazu gehören Spiele, bei denen er mit einer materiellen Behinderung beginnt. Offensichtlich sollte er mit der für das Spiel vereinbarten Zeitkontrolle üben.
Wenn möglich, sollte er sich Spiele anschauen, die von Alpha-Go gespielt werden, damit er spezifische Schwächen identifizieren kann. Idealerweise sollte der Vertrag des Spiels festgelegt haben, dass das Alpha-Go-Team solche Spiele während der Spielvorbereitung regelmäßig liefern sollte. Angesichts der Öffentlichkeit, die der Wettbewerb hervorbringen wird, bezweifeln wir, dass dies der Fall ist. Im Allgemeinen ist die Stärke von AlphaGo auch seine Schwäche: Es braucht Millionen von Positionen, um zu lernen und eine große Anzahl von Meisterspielen zu verwenden, weil es viel weniger Spiele von Spitzenspielern gibt, die gegeneinander antreten. Daher ist sein Spiel eher dem Spiel von Meistern als von Spitzenspielern nachempfunden. Meister sind offensichtlich schwächer als Top-Level-Spieler, und ein Weltklasse-Spieler wie Lee Sedol sollte in der Lage sein, dieses relativ unterlegene Wissen auszunutzen. AlphaGo lernt aber auch durch Selbstspiel. Inwieweit dies die Art von Lernspielen kompensiert, ist unbekannt und könnte der entscheidende Faktor für das Spiel sein.
Obwohl AlphaGo hervorragend in der Mustererkennung ist, die oft als das Merkmal menschlichen Fachwissens gilt (Gobet, 2015), ist AlphaGo bei der Suche nach Voraussagen schwächer. Dies liegt daran, dass die Suche eher statistisch erfolgt, indem kritische Linien untersucht werden. In dieser Hinsicht ist es das Gegenteil von Deep Blue, das für eine genaue Suche optimiert wurde. Lee Sedol könnte dies ausnutzen, indem er Positionen auswählt, die taktische Variationen enthalten, wobei das Urteil von einigen kritischen Bewegungen abhängt. Die statistische Suche von AlphaGo könnte diese Feinheiten vermissen und nach Linien suchen, die von der großen Mehrheit der Züge unterstützt, aber durch einen einzigen Zug widerlegt werden.
Für Lee Sedol wird das Dilemma sein, ob er gegen die Menschen spielen sollte oder seinen Stil ändern sollte, um hoffentlich die Schwächen von AlphaGo auszunutzen. Es besteht die Gefahr, Letzteres zu tun. Schachforschung hat gezeigt, dass Spieler, wenn sie außerhalb des Stils spielen, auf den sie sich spezialisiert haben, auf einer schwächeren Ebene spielen (Bilalic, McLeod & Gobet, 2009). Diese Schlussfolgerung wird wahrscheinlich auch für Go gelten. Darüber hinaus wird der Versuch, AlphaGos Denkweise vorauszusehen, kognitive Ressourcen einbeziehen, die dann nicht zum Spielen von Go verwendet werden.
Trotz der beeindruckenden Rechenfähigkeiten von AlphaGo und seiner bemerkenswerten Fähigkeit, Muster zu erkennen, hat Lee Sedol ein viel tieferes Verständnis für das Spiel. Angesichts der Ungewissheit über die wahre Stärke von AlphaGo ist es daher unser Rat an ihn, das Spiel zu beginnen, indem er das Spiel spielt, in dem er normalerweise brilliert. Nur wenn es sauer wird, sollte er Methoden anwenden, die darauf abzielen, die (vermuteten) Schwächen von AlphaGo direkt zu nutzen.
Fernand Gobet und Morgan Ereku
Verweise
Bilalić, M., McLeod, P. & Gobet, F. (2009). Spezialisierungseffekt und dessen Einfluss auf Gedächtnis und Problemlösung bei erfahrenen Schachspielern. Kognitionswissenschaft, 33 , 1117-1143.
Chib, V., Shimojo, S., und O'Doherty, J. (2014). Die Auswirkungen von Anreizrahmen auf Leistungsabnahmen für große monetäre Ergebnisse: Verhaltens- und neuronale Mechanismen. The Journal of Neuroscience, 34 , 14833-14844.
Gobet, F. (2015). Fachwissen verstehen: Ein multidisziplinärer Ansatz . London: Palgrave.
Hsu, F.-H. (2002). Hinter Deep Blue: Den Computer bauen, der den Schachweltmeister besiegt hat . Princeton, New Jersey: Princeton University Press.