Nel marzo 2016, AlphaGo di Google DeepMind ha sbalordito il mondo sconfiggendo Lee Sedol, allora il miglior giocatore di Go al mondo. Questa vittoria non è stata solo una vittoria in partita; ha segnato un grande passo avanti nell’intelligenza artificiale. La storia dietro AlphaGo parla meno di una svolta improvvisa e più di uno sforzo mirato, iniziato con una semplice idea di uno stagista.
La scintilla iniziale
Il progetto è iniziato con una domanda posta da Ilya Sutskever, in seguito co-fondatore di OpenAI: un’IA potrebbe imparare a giocare a Go a livello esperto? Sutskever sosteneva che se i giocatori umani scegliessero le mosse entro mezzo secondo, una rete neurale dovrebbe essere in grado di approssimare tale processo. Ciò si basava su precedenti successi nel riconoscimento delle immagini, in cui l’intelligenza artificiale aveva già dimostrato la sua capacità di elaborare rapidamente le informazioni visive.
Chris Maddison, allora studente di master, si è unito a Google Brain come stagista nell’estate del 2014 per iniziare a costruire le reti neurali necessarie. Il team, che includeva Aja Huang e David Silver, inizialmente ha testato vari approcci. Maddison ha scoperto che la strategia più semplice – addestrare una rete neurale a prevedere la prossima mossa che un esperto avrebbe fatto – ha prodotto i risultati migliori.
Dal progetto di tirocinio al fenomeno globale
Alla fine di quell’estate, le reti di Maddison stavano già battendo gli stessi giocatori di DeepMind. Questo successo iniziale ha portato a maggiori investimenti e a un team più ampio dedicato al progetto. L’obiettivo si è spostato dalla prova di concetto al battere i migliori del mondo.
Il team ha mantenuto l’immagine di Lee Sedol sulle proprie scrivanie come costante promemoria della sfida. Ogni miglioramento dell’IA è stato misurato rispetto al suo livello di abilità. Come ha detto Maddison, “Stiamo un po’ meglio, quanto siamo vicini a Lee Sedol?” La risposta, secondo Huang, era che Sedol era “una pietra proveniente da Dio”.
La partita di Seul e oltre
Maddison ha lasciato il progetto prima della storica partita contro il Sedol, scegliendo di concentrarsi sul suo dottorato. Tuttavia, il suo lavoro iniziale gettò le basi per l’intelligenza artificiale che alla fine avrebbe vinto. L’atmosfera a Seul durante le partite era intensa. Nonostante la fiducia nell’intelligenza artificiale, c’era un senso di incertezza. Anche con un vantaggio statistico, tutto potrebbe succedere.
La vittoria non è stata solo una vittoria per DeepMind, ma un momento culturale. Centinaia di milioni di persone solo in Cina hanno assistito alla prima partita e la folla si è radunata a Seul per guardare le partite in diretta su schermi giganti.
L’evoluzione dell’intelligenza artificiale: l’impatto duraturo di AlphaGo
Il successo di AlphaGo non è stato un evento isolato. Ha gettato le basi per i moderni sistemi di intelligenza artificiale, compresi i modelli linguistici di grandi dimensioni (LLM). Il principio fondamentale rimane lo stesso: addestrare una rete neurale a prevedere l’elemento successivo (mossa o parola) sulla base dei dati esistenti, quindi perfezionare quel modello utilizzando l’apprendimento per rinforzo per allinearlo con obiettivi specifici.
La chiave per progredire, come ha dimostrato AlphaGo, non sono solo algoritmi intelligenti, ma anche disporre di dati sufficienti per il pre-allenamento e chiari segnali di ricompensa per il post-allenamento. Senza questi ingredienti, nessuna innovazione tecnica sarà sufficiente.
L’elemento umano
La vittoria su Lee Sedol è stata agrodolce. Lo stesso Sedol si scusò con l’umanità per la sua perdita, definendola il suo fallimento, non il loro. La tradizione della revisione post-partita, pietra angolare della cultura Go, era impossibile perché AlphaGo non era umano. La squadra ha visto gli amici di Sedol intervenire per riempire il vuoto, ma non era la stessa cosa.
In definitiva, AlphaGo è stato il prodotto di uno sforzo collettivo, una “tribù” che ha costruito un artefatto capace di superare l’abilità umana in un gioco complesso. L’obiettivo di Go potrebbe essere quello di vincere, ma il suo scopo si estende all’intrattenimento e all’esplorazione, garantendo che, anche con il predominio dell’intelligenza artificiale, l’impegno umano duri.
























