Comment un stagiaire a aidé à créer l’IA qui a bouleversé le monde

7
Comment un stagiaire a aidé à créer l’IA qui a bouleversé le monde

En mars 2016, AlphaGo de Google DeepMind a stupéfié le monde en battant Lee Sedol, alors joueur de Go le mieux classé au monde. Cette victoire n’était pas seulement une victoire de match ; cela a marqué un bond majeur dans l’intelligence artificielle. L’histoire d’AlphaGo concerne moins une percée soudaine qu’un effort ciblé, commençant par une simple idée d’un stagiaire.

L’étincelle initiale

Le projet a commencé avec une question posée par Ilya Sutskever, plus tard co-fondateur d’OpenAI : une IA pourrait-elle apprendre à jouer au Go à un niveau expert ? Sutskever a soutenu que si les joueurs humains choisissent leurs mouvements en une demi-seconde, un réseau neuronal devrait être capable de se rapprocher de ce processus. Cela s’appuyait sur des succès antérieurs en matière de reconnaissance d’images, où l’IA avait déjà prouvé sa capacité à traiter rapidement les informations visuelles.

Chris Maddison, alors étudiant à la maîtrise, a rejoint Google Brain en tant que stagiaire à l’été 2014 pour commencer à construire les réseaux neuronaux nécessaires. L’équipe, composée d’Aja Huang et de David Silver, a d’abord testé diverses approches. Maddison a découvert que la stratégie la plus simple – entraîner un réseau de neurones pour prédire le prochain mouvement qu’un expert ferait – donnait les meilleurs résultats.

Du projet interne au phénomène mondial

À la fin de cet été, les réseaux de Maddison battaient déjà les propres joueurs de DeepMind. Ce premier succès a conduit à une augmentation des investissements et à une plus grande équipe dédiée au projet. L’objectif est passé de la preuve de concept à celui de battre les meilleurs au monde.

L’équipe a gardé l’image de Lee Sedol sur son bureau comme un rappel constant du défi. Chaque amélioration de l’IA était mesurée par rapport à son niveau de compétence. Comme l’a dit Maddison : « Nous sommes un peu meilleurs, à quel point sommes-nous proches de Lee Sedol ? La réponse, selon Huang, était que Sedol était « une pierre de Dieu ».

Le match de Séoul et au-delà

Maddison a quitté le projet avant le match historique contre Sedol, choisissant de se concentrer sur son doctorat. Cependant, ses premiers travaux ont jeté les bases de l’IA qui finirait par gagner. L’ambiance à Séoul pendant les matches était intense. Malgré la confiance dans l’IA, un sentiment d’incertitude régnait. Même avec un avantage statistique, tout peut arriver.

La victoire n’était pas seulement une victoire pour DeepMind, mais un moment culturel. Rien qu’en Chine, des centaines de millions de personnes ont regardé le premier match et des foules se sont rassemblées à Séoul pour regarder les matchs en direct sur des écrans géants.

L’évolution de l’IA : l’impact durable d’AlphaGo

Le succès d’AlphaGo n’était pas un événement isolé. Il a jeté les bases des systèmes d’IA modernes, notamment des grands modèles de langage (LLM). Le principe de base reste le même : entraîner un réseau de neurones pour prédire l’élément suivant (mouvement ou mot) sur la base des données existantes, puis affiner ce modèle à l’aide de l’apprentissage par renforcement pour l’aligner sur des objectifs spécifiques.

La clé du progrès, comme l’a démontré AlphaGo, ne réside pas seulement dans des algorithmes intelligents, mais également dans le fait de disposer de suffisamment de données pour le pré-entraînement et de signaux de récompense clairs pour le post-entraînement. Sans ces ingrédients, aucune innovation technique ne suffira.

L’élément humain

La victoire sur Lee Sedol a été douce-amère. Sedol lui-même s’est excusé auprès de l’humanité pour sa perte, qualifiant cela de son échec et non du leur. La tradition de l’examen d’après-match, pierre angulaire de la culture Go, était impossible car AlphaGo n’était pas humain. L’équipe a vu les amis de Sedol intervenir pour combler le vide, mais ce n’était pas pareil.

En fin de compte, AlphaGo était le produit d’un effort collectif, d’une « tribu » construisant un artefact capable de surpasser les compétences humaines dans un jeu complexe. L’objectif de Go est peut-être de gagner, mais son objectif s’étend au divertissement et à l’exploration, garantissant que même avec la domination de l’IA, l’engagement humain perdure.