Штучний інтелект та творчість: ДТП чи неминучість?
В останні роки світ був захоплений здібностями штучного інтелекту (AI) створити дивовижні твори мистецтва, музики та тексту. Генеративні моделі, такі як Dall-E, Imagen та стабільна дифузія, здатні генерувати образи, які, здається, не тільки для імітації реальності, але й проявом чогось подібного до творчості. Однак, що стоїть за цим, здавалося б, диво? Це справжня творчість, чи це просто складний алгоритм, який відтворює шаблони, отримані з величезного масиву даних?
Недавнє дослідження, проведене фізиками зі Стенфордського університету, кидає нове світло на це питання, пропонуючи вражаючу гіпотезу: робота генеративних моделей ШІ не є випадковим процесом, а скоріше неминучим наслідком їх архітектури. Ця ідея, на перший погляд, може здатися конвекційною, тому що ми звикли думати про творчість як про щось спонтанне та непередбачуване. Але якщо ви заглиблюєтесь у деталі, стає зрозуміло, що ця гіпотеза має вагомі причини.
Локальна фокус та еквівалентність мовлення: ключ до розуміння
Дослідники визначили два ключові елементи, які, на їхню думку, є основою творчого потенціалу генеративних моделей:Місцевість ІЕквівалентність мовлення. Місцевість означає, що модель зосереджується лише на невеликій області зображення одночасно, ігноруючи контекст більш широкої картини. Поперечна еквівалентність, у свою чергу, вимагає, щоб із переходом вхідного зображення на кілька пікселів модель автоматично виправляє вихідне зображення відповідно.
Спочатку ці обмеження розглядалися як прості незручності, що перешкоджає створенню ідеальних копій зображень. Однак нове дослідження показує, що саме ці обмеження є причиною появи “творчості”. Коли модель змушена працювати з окремими розділами зображення, не маючи уявлення про те, як вони вписуються в загальну картину, вона починає поєднувати їх по -новому, створюючи щось, що виходить за рамки простого відтворення.
Паралелі з морфогенезом: від ембріонів до мистецтва
Цікаво, що дослідники провели паралель між процесом генерування зображень ШІ та морфогенезу – процесом, за допомогою яких живі системи є самоорганізованими. Зокрема, вони пам’ятали закономірності Тьюрінга, які пояснюють, як групи клітин в ембріонах організовані в окремі органи та кінцівки. У цьому процесі немає “головного директора”, який би керував кожною кліткою. Натомість клітини взаємодіють між собою, реагуючи на сигнали від сусідів. Цей процес самоорганізації може призвести до несподіваних результатів, таких як поява зайвих пальців.
Аналогічно, генеративні моделі ШІ, які працюють з окремими розділами зображення, можуть створити несподівані комбінації, які призводять до сюрреалістичних і часто дуже цікавих зображень. Цей момент, коли “щось піде не так”, коли система відхиляється від передбачуваного результату, може розглядатися як прояв творчості.
Що це означає для нас?
Відкриття дослідників має далекосяжні наслідки для розуміння творчості як такої. Якщо робота ШІ є неминучим наслідком певних архітектурних обмежень, чи можна стверджувати, що людська творчість має свої коріння в деяких обмеженнях щодо нашого сприйняття та мислення?
Ми постійно працюємо з неповною інформацією, робимо припущення та заповнюємо прогалини в наших знаннях. Можливо, те, що ми називаємо “натхненням” або “розумінням”, насправді просто результатом заповнення цих прогалин по-новому, в нео-вайст.
Мій особистий досвід
Я займався цифровим мистецтвом кілька років, і мені завжди здавалося, що процес створення чогось нового – це баланс між контролем та спонтанністю. Я починаю з певної концепції чи ідеї, але тоді я дозволяю собі експериментувати з різними методами та інструментами, не боячись відхилятися від початкового плану. Часто найцікавіші та оригінальні твори народжуються точно в ці моменти, коли я дозволяю собі “випустити контроль” та довіру до інтуїції.
Я пригадую випадок, коли працював над проектом, присвяченим темі часу. Я хотів створити візуальну метафору, яка б відображала її ефемерну та невловиму характер. Після кількох невдалих спроб, я вирішив використовувати техніку “Шумне мистецтво”, яка полягає у створенні зображень шляхом випадкового спотворення оригінального зображення. На мій подив, цей випадковий процес призвів до створення серії творів, які прекрасно відображали мою ідею. Ці твори були далеко не ідеальними від технічної точки зору, але вони мали деяку незрозумілу силу та красу, які я не міг створити навмисно.
Висновки та перспективи
Дослідження, проведене фізиками зі Стенфордського університету, викликає ряд важливих питань щодо природи творчості та його можливостей. Якщо робота ШІ є неминучим наслідком певних архітектурних обмежень, то як це впливає на наше розуміння творчості як такої?
Більше того, це відкриття відкриває нові перспективи розвитку штучного інтелекту. Замість того, щоб намагатися створити ШІ, який би повністю наслідував людську творчість, ми можемо зосередитись на розробці систем, які б використовували наші власні обмеження, щоб створити щось нове та унікальне.
Зрештою, дослідження про роботу ШІ може допомогти нам краще зрозуміти себе та наше місце у світі. Це показує, що творчість – це не просто дар обраних, а фундаментальний процес, який може проявлятися в різних формах, як в людському, так і в штучному інтелекті. Можливо, ключовим фактором розкриття всього потенціалу творчості є визнання та використання обмежень, що формують наш досвід та наше сприйняття.
Що далі?
Я думаю, що в майбутньому ми побачимо ще більше досліджень щодо роботи ШІ. Особливий інтерес викликає дослідження, спрямовані на вивчення того, як різні архітектурні обмеження впливають на творчий потенціал різних типів моделей ШІ. Також буде цікаво вивчити, як можна використовувати обмеження для створення нових типів мистецтва та дизайну. І, звичайно, буде важливо продовжувати задавати собі питання про те, що означає бути творчим в епоху штучного інтелекту.