Как Стажер Помог Создать ИИ, Который Перевернул Мир

8

В марте 2016 года AlphaGo от Google DeepMind ошеломила мир, победив Ли Седоля, тогдашнего лучшего игрока в Го. Эта победа была не просто выигрышем в игре; она ознаменовала огромный скачок в искусственном интеллекте. История AlphaGo – это не внезапный прорыв, а скорее результат целенаправленных усилий, начавшихся с простой идеи от стажера.

Первоначальный Импульс

Проект начался с вопроса, заданного Ильей Суцкевером, будущим сооснователем OpenAI: может ли ИИ научиться играть в Го на экспертном уровне? Суцкевер утверждал, что если люди выбирают ходы в течение половины секунды, нейронная сеть должна быть способна приближенно воспроизвести этот процесс. Это основывалось на предыдущих успехах в распознавании изображений, где ИИ уже доказал свою способность быстро обрабатывать визуальную информацию.

Крис Мэддисон, тогда студент магистратуры, присоединился к Google Brain в качестве стажера летом 2014 года, чтобы начать разработку необходимых нейронных сетей. Команда, включающая Аю Хуан и Дэвида Сильвера, изначально протестировала различные подходы. Мэддисон обнаружил, что самая простая стратегия – обучить нейронную сеть предсказывать следующий ход, который сделает эксперт, – давала наилучшие результаты.

От Стажерского Проекта к Глобальному Феномену

К концу этого лета сети Мэддисона уже обыгрывали собственных игроков DeepMind. Этот ранний успех привел к увеличению инвестиций и расширению команды, работающей над проектом. Цель сместилась с доказательства концепции на победу над лучшим в мире.

Команда держала изображение Ли Седоля на своих столах как постоянное напоминание об испытании. Каждое улучшение ИИ измерялось по его уровню мастерства. Как выразился Мэддисон: «Мы немного лучше, насколько мы близки к Ли Седолю?» Ответ, по словам Хуан, заключался в том, что Седоль был «в одном камне от Бога».

Матч в Сеуле и Дальше

Мэддисон покинул проект до исторического матча против Седоля, решив сосредоточиться на своей докторской диссертации. Однако его первоначальная работа заложила основу для ИИ, который в конечном итоге победил. Атмосфера в Сеуле во время матчей была напряженной. Несмотря на уверенность в ИИ, ощущалась неопределенность. Даже при статистическом преимуществе могло случиться что угодно.

Победа была не просто победой для DeepMind, а культурным моментом. Сотни миллионов людей только в Китае смотрели первую игру, а толпы собрались в Сеуле, чтобы смотреть матчи в прямом эфире на гигантских экранах.

Эволюция ИИ: Долгосрочное Влияние AlphaGo

Успех AlphaGo не был изолированным событием. Он заложил основу для современных ИИ-систем, включая большие языковые модели (LLM). Основной принцип остается прежним: обучить нейронную сеть предсказывать следующий элемент (ход или слово) на основе существующих данных, а затем уточнить эту модель с помощью обучения с подкреплением, чтобы привести ее в соответствие с конкретными целями.

Ключ к прогрессу, как продемонстрировала AlphaGo, заключается не только в умных алгоритмах, но и в наличии достаточного количества данных для предварительного обучения и четких сигналов вознаграждения для последующего обучения. Без этих ингредиентов ни одно техническое новшество не поможет.

Человеческий Фактор

Победа над Ли Седолем была горько-сладкой. Сам Седоль извинился перед человечеством за свое поражение, назвав его своей неудачей, а не их. Традиция послематчевого анализа, краеугольный камень культуры Го, была невозможна, потому что AlphaGo не была человеком. Команда наблюдала, как друзья Седоля попытались заполнить пустоту, но это было не то же самое.

В конечном итоге AlphaGo была продуктом коллективных усилий, «племени», создающего артефакт, способный превзойти человеческие навыки в сложной игре. Цель Го может заключаться в победе, но ее назначение выходит за рамки развлечений и исследования, обеспечивая, что даже при доминировании ИИ человеческая вовлеченность сохранится.