Im März 2016 überraschte AlphaGo von Google DeepMind die Welt, indem es Lee Sedol besiegte, den damals weltbesten Go-Spieler. Dieser Sieg war nicht nur ein Spielgewinn; es signalisierte einen großen Sprung in der künstlichen Intelligenz. Bei der Geschichte hinter AlphaGo geht es weniger um einen plötzlichen Durchbruch als vielmehr um gezielte Bemühungen, beginnend mit einer einfachen Idee eines Praktikanten.
Der Initialzündung
Das Projekt begann mit einer Frage von Ilya Sutskever, dem späteren Mitbegründer von OpenAI: Könnte eine KI lernen, Go auf Expertenniveau zu spielen? Sutskever argumentierte, dass ein neuronales Netzwerk in der Lage sein sollte, diesen Prozess anzunähern, wenn menschliche Spieler ihre Züge innerhalb einer halben Sekunde auswählen. Grundlage dafür waren frühere Erfolge bei der Bilderkennung, bei denen KI bereits ihre Fähigkeit unter Beweis gestellt hatte, visuelle Informationen schnell zu verarbeiten.
Chris Maddison, damals Masterstudent, kam im Sommer 2014 als Praktikant zu Google Brain, um mit dem Aufbau der notwendigen neuronalen Netze zu beginnen. Das Team, darunter Aja Huang und David Silver, testete zunächst verschiedene Ansätze. Maddison stellte fest, dass die einfachste Strategie – das Trainieren eines neuronalen Netzwerks, um den nächsten Schritt eines Experten vorherzusagen – die besten Ergebnisse lieferte.
Vom Praktikantenprojekt zum globalen Phänomen
Am Ende des Sommers schlugen Maddisons Netzwerke bereits die eigenen Spieler von DeepMind. Dieser frühe Erfolg führte zu höheren Investitionen und einem größeren Team, das sich dem Projekt widmete. Das Ziel verlagerte sich vom Proof-of-Concept hin zum Sieg über die Besten der Welt.
Das Team hatte das Bild von Lee Sedol auf seinen Schreibtischen als ständige Erinnerung an die Herausforderung. Jede Verbesserung der KI wurde an seinem Fähigkeitsniveau gemessen. Wie Maddison es ausdrückte: „Wir sind ein bisschen besser, wie nah sind wir an Lee Sedol?“ Laut Huang war die Antwort, dass Sedol „einen Stein von Gott entfernt“ war.
Das Seoul Match und darüber hinaus
Maddison verließ das Projekt vor dem historischen Spiel gegen Sedol und konzentrierte sich stattdessen auf seine Doktorarbeit. Seine ersten Arbeiten legten jedoch den Grundstein für die KI, die letztendlich siegen sollte. Die Atmosphäre in Seoul während der Spiele war intensiv. Trotz des Vertrauens in die KI herrschte ein Gefühl der Unsicherheit. Selbst mit statistischem Vorteil könnte alles passieren.
Der Sieg war nicht nur ein Sieg für DeepMind, sondern ein kultureller Moment. Allein in China verfolgten Hunderte Millionen Menschen das erste Spiel, und in Seoul versammelten sich Menschenmengen, um die Spiele live auf riesigen Bildschirmen zu verfolgen.
Die Entwicklung der KI: Die nachhaltige Wirkung von AlphaGo
Der Erfolg von AlphaGo war kein Einzelfall. Es legte den Grundstein für moderne KI-Systeme, einschließlich großer Sprachmodelle (LLMs). Das Grundprinzip bleibt dasselbe: Trainieren Sie ein neuronales Netzwerk, um das nächste Element (Bewegung oder Wort) basierend auf vorhandenen Daten vorherzusagen, und verfeinern Sie dann dieses Modell mithilfe von Reinforcement Learning, um es an bestimmten Zielen auszurichten.
Der Schlüssel zum Fortschritt liegt, wie AlphaGo gezeigt hat, nicht nur in cleveren Algorithmen, sondern auch in ausreichenden Daten vor dem Training und klaren Belohnungssignalen nach dem Training. Ohne diese Zutaten wird keine noch so große technische Innovation ausreichen.
Das menschliche Element
Der Sieg über Lee Sedol war bittersüß. Sedol selbst entschuldigte sich bei der Menschheit für seinen Verlust und nannte es sein Versagen, nicht ihres. Die Tradition der Überprüfung nach dem Spiel, ein Eckpfeiler der Go-Kultur, war unmöglich, weil AlphaGo kein Mensch war. Das Team sah zu, wie Sedols Freunde einsprangen, um die Lücke zu füllen, aber es war nicht dasselbe.
Letztlich war AlphaGo das Produkt einer kollektiven Anstrengung, eines „Stammes“, der ein Artefakt baute, das in der Lage war, die menschlichen Fähigkeiten in einem komplexen Spiel zu übertreffen. Das Ziel von Go mag der Sieg sein, aber sein Zweck erstreckt sich auch auf Unterhaltung und Erkundung und stellt sicher, dass das menschliche Engagement auch bei der Dominanz der KI bestehen bleibt.
























