Як стажист допоміг створити штучний інтелект, який змінив світ

2

У березні 2016 року AlphaGo від Google DeepMind приголомшив світ, перемігши Лі Седола, на той час найкращого гравця в Go. Ця перемога була не просто виграшем у грі; це ознаменувало величезний стрибок у розвитку штучного інтелекту. Історія AlphaGo — це не раптовий прорив, а радше результат цілеспрямованих зусиль, які почалися з простої ідеї стажера.

Початковий імпульс

Проект розпочався із питання, яке поставив Ілля Суцкевер, майбутній співзасновник OpenAI: чи може ШІ навчитися грати в Go на експертному рівні? Суцкевер стверджував, що якщо люди вибирають свої кроки протягом півсекунди, нейронна мережа повинна мати можливість наближено оцінити цей процес. Це ґрунтувалося на попередніх успіхах у розпізнаванні зображень, де ШІ вже довів свою здатність швидко обробляти візуальну інформацію.

Кріс Меддісон, який тоді був студентом магістратури, приєднався до Google Brain як стажер влітку 2014 року, щоб розпочати розробку необхідних нейронних мереж. Команда, у тому числі Ая Хуанг і Девід Сільвер, спочатку випробувала різні підходи. Меддісон виявив, що найпростіша стратегія — навчити нейронну мережу передбачати наступний крок експерта — дала найкращі результати.

Від внутрішнього проекту до глобального явища

До кінця того літа мережі Меддісона вже перемагали гравців DeepMind. Цей ранній успіх призвів до збільшення інвестицій і розширення команди, яка працювала над проектом. Мета змінилася від підтвердження концепції до перемоги над найкращими у світі.

Команда тримала фотографію Лі Седола на своїх столах як постійне нагадування про важкі випробування. Кожне вдосконалення штучного інтелекту оцінювалося його рівнем навичок. Як сказав Меддісон: «Чи ми трохи кращі, наскільки ми близькі до Лі Седола?» Відповідь, сказав Хуанг, полягала в тому, що Седол був «в одному камені від Бога».

Матч у Сеулі та за його межами

Меддісон покинув проект перед історичним матчем проти Седоля, вирішивши зосередитися на докторській дисертації. Однак його початкова робота заклала основу для штучного інтелекту, який зрештою переможе. Атмосфера в Сеулі під час матчів була напруженою. Незважаючи на довіру до ШІ, було відчуття невпевненості. Навіть зі статистичною перевагою все може статися.

Перемога була не просто перемогою DeepMind, а культурним моментом. Сотні мільйонів людей лише в Китаї спостерігали за першою грою, а натовпи стікалися до Сеула, щоб дивитися матчі в прямому ефірі на величезних екранах.

Еволюція ШІ: довгостроковий вплив AlphaGo

Успіх AlphaGo не був одиничною подією. Він заклав основу для сучасних систем ШІ, включаючи великі мовні моделі (LLM). Основний принцип залишається незмінним: навчити нейронну мережу передбачати наступний елемент (хід або слово) на основі наявних даних, а потім удосконалити цю модель за допомогою навчання з підкріпленням, щоб узгодити її з конкретними цілями.

Ключ до прогресу, як продемонструвала AlphaGo, полягає не лише в розумних алгоритмах, але й у наявності достатньої кількості даних для попереднього навчання та чітких сигналів винагороди для наступного навчання. Без цих інгредієнтів не допоможуть жодні технічні новинки.

Людський фактор

Перемога над Лі Седолем була гіркою. Сам Седол вибачився перед людством за свою поразку, назвавши її своєю, а не їхньою. Традиція післяматчевого аналізу, наріжний камінь культури Go, була неможливою, оскільки AlphaGo не був людиною. Команда спостерігала, як друзі Седоля намагалися заповнити порожнечу, але це було не те.

Зрештою, AlphaGo був продуктом колективних зусиль, «племені», яке створило артефакт, здатний перевершити людські навички в складній грі. Ціллю Go може бути перемога, але її мета виходить за рамки розваг і досліджень, гарантуючи, що навіть за домінування штучного інтелекту людська участь залишиться.