V březnu 2016 ohromil AlphaGo od Google DeepMind svět tím, že porazil Lee Sedola, tehdy nejlepšího hráče Go. Toto vítězství nebylo jen vítězstvím ve hře; znamenalo obrovský skok vpřed v oblasti umělé inteligence. Příběh AlphaGo není náhlým průlomem, ale spíše výsledkem soustředěného úsilí, které začalo jednoduchým nápadem stážisty.
Počáteční impuls
Projekt začal otázkou, kterou položil Ilya Sutskever, budoucí spoluzakladatel OpenAI: mohla by se umělá inteligence naučit hrát Go na expertní úrovni? Sutskever tvrdil, že pokud lidé zvolí své pohyby během půl sekundy, neuronová síť by měla být schopna tento proces aproximovat. To navázalo na předchozí úspěchy v rozpoznávání obrázků, kde AI již prokázala svou schopnost rychle zpracovávat vizuální informace.
Chris Maddison, tehdejší magisterský student, nastoupil do Google Brain jako stážista v létě 2014, aby začal s vývojem nezbytných neuronových sítí. Tým, včetně Ayi Huang a Davida Silvera, zpočátku testoval různé přístupy. Maddison zjistila, že nejlepší výsledky přinesla nejjednodušší strategie – trénování neuronové sítě k předvídání dalšího kroku experta.
Od Intern Project ke globálnímu fenoménu
Na konci léta již Maddisonovy sítě porážely vlastní hráče DeepMind. Tento časný úspěch vedl ke zvýšení investic a rozšíření týmu pracujícího na projektu. Cíl se posunul od proof of concept k poražení těch nejlepších na světě.
Tým měl na stole obrázek Lee Sedola jako neustálou připomínku utrpení. Každé zlepšení AI bylo měřeno úrovní jeho dovedností. Jak řekla Maddison: “Jsme trochu lepší, jak blízko jsme k Lee Sedol?” Odpověď, řekl Huang, byla, že Sedol je „od Boha vzdálený jeden kámen“.
Zápas v Soulu a dále
Maddison opustil projekt před historickým zápasem proti Sedolu a rozhodl se soustředit na svůj doktorát. Jeho počáteční práce však položila základ pro AI, která nakonec zvítězila. Atmosféra v Soulu během zápasů byla napjatá. Navzdory důvěře v AI tu byl pocit nejistoty. I se statistickou výhodou se může stát cokoliv.
Vítězství nebylo jen vítězstvím DeepMind, ale kulturním momentem. Stamiliony lidí jen v Číně sledovaly první zápas, davy lidí proudily do Soulu, aby zápasy sledovaly živě na obřích obrazovkách.
Evoluce AI: Dlouhodobý dopad AlphaGo
Úspěch AlphaGo nebyl ojedinělou událostí. Položil základ pro moderní systémy umělé inteligence, včetně velkých jazykových modelů (LLM). Základní princip zůstává stejný: trénujte neuronovou síť tak, aby předpovídala další položku (tah nebo slovo) na základě existujících dat, a poté tento model upřesněte pomocí posilovacího učení, abyste jej sladili s konkrétními cíli.
Klíč k pokroku, jak ukázal AlphaGo, nespočívá pouze v chytrých algoritmech, ale také v dostatku dat pro předtrénink a jasných signálech odměn pro následný trénink. Bez těchto přísad nepomůže žádná technická inovace.
Lidský faktor
Vítězství nad Lee Sedolem bylo hořkosladké. Sám Sedol se lidstvu za svou porážku omluvil a označil to za své selhání, ne za jejich. Tradice pozápasové analýzy, základní kámen kultury Go, byla nemožná, protože AlphaGo nebyl člověk. Tým sledoval, jak se Sedolovi přátelé snažili zaplnit prázdnotu, ale nebylo to ono.
AlphaGo byl nakonec produktem kolektivního úsilí, „kmenem“ vytvářejícím artefakt schopný překonat lidské dovednosti ve složité hře. Cílem Go může být vyhrát, ale jeho účel přesahuje zábavu a průzkum a zajišťuje, že i přes dominanci AI zůstane lidská angažovanost.






















