Como um estagiário ajudou a construir a IA que abalou o mundo

9

Em março de 2016, o AlphaGo do Google DeepMind surpreendeu o mundo ao derrotar Lee Sedol, então o melhor jogador de Go do mundo. Esta vitória não foi apenas uma vitória no jogo; sinalizou um grande salto na inteligência artificial. A história por trás do AlphaGo é menos sobre uma descoberta repentina e mais sobre um esforço concentrado, começando com uma ideia simples de um estagiário.

A faísca inicial

O projeto começou com uma pergunta feita por Ilya Sutskever, mais tarde cofundador da OpenAI: poderia uma IA aprender a jogar Go em nível de especialista? Sutskever argumentou que se jogadores humanos escolhessem movimentos em meio segundo, uma rede neural deveria ser capaz de aproximar esse processo. Isto baseou-se em sucessos anteriores no reconhecimento de imagens, onde a IA já tinha provado a sua capacidade de processar informações visuais rapidamente.

Chris Maddison, então estudante de mestrado, ingressou no Google Brain como estagiário no verão de 2014 para começar a construir as redes neurais necessárias. A equipe, incluindo Aja Huang e David Silver, testou inicialmente várias abordagens. Maddison descobriu que a estratégia mais simples – treinar uma rede neural para prever o próximo movimento que um especialista faria – produzia os melhores resultados.

Do Projeto Estagiário ao Fenômeno Global

No final daquele verão, as redes de Maddison já estavam derrotando os próprios jogadores da DeepMind. Esse sucesso inicial levou a um aumento do investimento e a uma equipe maior dedicada ao projeto. O objetivo mudou da prova de conceito para vencer os melhores do mundo.

A equipe manteve a imagem de Lee Sedol em suas mesas como um lembrete constante do desafio. Cada melhoria na IA foi medida em relação ao seu nível de habilidade. Como disse Maddison: “Estamos um pouco melhores, quão perto estamos de Lee Sedol?” A resposta, segundo Huang, foi que Sedol estava “a uma pedra de Deus”.

A partida de Seul e além

Maddison deixou o projeto antes da partida histórica contra o Sedol, optando por focar no doutorado. No entanto, o seu trabalho inicial lançou as bases para a IA que acabaria por vencer. O clima em Seul durante as partidas foi intenso. Apesar da confiança na IA, havia uma sensação de incerteza. Mesmo com vantagem estatística, tudo pode acontecer.

A vitória não foi apenas uma vitória para a DeepMind, mas um momento cultural. Centenas de milhões de pessoas só na China assistiram ao primeiro jogo e multidões reuniram-se em Seul para assistir aos jogos ao vivo em ecrãs gigantes.

A evolução da IA: o impacto duradouro do AlphaGo

O sucesso do AlphaGo não foi um evento isolado. Lançou as bases para sistemas modernos de IA, incluindo grandes modelos de linguagem (LLMs). O princípio básico permanece o mesmo: treinar uma rede neural para prever o próximo elemento (movimento ou palavra) com base nos dados existentes e, em seguida, refinar esse modelo usando aprendizagem por reforço para alinhá-lo com objetivos específicos.

A chave para o progresso, como demonstrou o AlphaGo, não são apenas algoritmos inteligentes, mas ter dados suficientes para o pré-treinamento e sinais claros de recompensa para o pós-treinamento. Sem estes ingredientes, nenhuma inovação técnica será suficiente.

O Elemento Humano

A vitória sobre Lee Sedol foi agridoce. O próprio Sedol pediu desculpas à humanidade por sua perda, chamando-a de falha sua, não deles. A tradição de revisão pós-jogo, uma pedra angular da cultura Go, era impossível porque o AlphaGo não era humano. A equipe observou os amigos de Sedol intervirem para preencher a lacuna, mas não foi a mesma coisa.

Em última análise, AlphaGo foi o produto de um esforço coletivo, uma “tribo” construindo um artefato capaz de superar a habilidade humana em um jogo complexo. O objetivo do Go pode ser vencer, mas o seu propósito estende-se ao entretenimento e à exploração, garantindo que mesmo com o domínio da IA, o envolvimento humano perdurará.