Bagaimana Seorang Magang Membantu Membangun AI yang Mengguncang Dunia

13

Pada bulan Maret 2016, AlphaGo Google DeepMind mengejutkan dunia dengan mengalahkan Lee Sedol, yang saat itu merupakan pemain Go peringkat teratas dunia. Kemenangan ini bukan sekedar kemenangan dalam pertandingan; ini menandakan lompatan besar dalam kecerdasan buatan. Kisah di balik AlphaGo bukan tentang terobosan mendadak, melainkan tentang upaya yang terfokus, dimulai dengan ide sederhana dari seorang pekerja magang.

Percikan Awal

Proyek ini dimulai dengan pertanyaan yang diajukan oleh Ilya Sutskever, yang kemudian menjadi salah satu pendiri OpenAI: bisakah AI belajar bermain Go pada tingkat ahli? Sutskever berpendapat bahwa jika pemain manusia memilih gerakan dalam waktu setengah detik, jaringan saraf harus dapat memperkirakan proses tersebut. Hal ini didasarkan pada keberhasilan sebelumnya dalam pengenalan gambar, dimana AI telah membuktikan kemampuannya dalam memproses informasi visual dengan cepat.

Chris Maddison, yang saat itu merupakan mahasiswa master, bergabung dengan Google Brain sebagai pekerja magang pada musim panas tahun 2014 untuk mulai membangun jaringan saraf yang diperlukan. Tim, termasuk Aja Huang dan David Silver, pada awalnya menguji berbagai pendekatan. Maddison menemukan bahwa strategi paling sederhana – melatih jaringan saraf untuk memprediksi langkah selanjutnya yang akan diambil oleh seorang pakar – memberikan hasil terbaik.

Dari Proyek Magang hingga Fenomena Global

Pada akhir musim panas itu, jaringan Maddison sudah mengalahkan pemain DeepMind sendiri. Keberhasilan awal ini menghasilkan peningkatan investasi dan tim yang lebih besar yang berdedikasi pada proyek tersebut. Tujuannya beralih dari pembuktian konsep menjadi mengalahkan yang terbaik di dunia.

Tim menyimpan gambar Lee Sedol di meja mereka sebagai pengingat akan tantangan tersebut. Setiap peningkatan AI diukur berdasarkan tingkat keahliannya. Seperti yang dikatakan Maddison, “Kami sedikit lebih baik, seberapa dekat kami dengan Lee Sedol?” Jawabannya, menurut Huang, Sedol adalah “satu batu dari Tuhan”.

Pertandingan Seoul dan Sesudahnya

Maddison meninggalkan proyek tersebut sebelum pertandingan bersejarah melawan Sedol, memilih untuk fokus pada gelar PhD-nya. Namun, karya awalnya meletakkan dasar bagi AI yang pada akhirnya akan menang. Suasana di Seoul selama pertandingan sangat intens. Meskipun terdapat kepercayaan terhadap AI, terdapat rasa ketidakpastian. Bahkan dengan keunggulan statistik, apapun bisa terjadi.

Kemenangan tersebut bukan sekadar kemenangan DeepMind, melainkan momen budaya. Ratusan juta orang di Tiongkok saja menyaksikan pertandingan pertama, dan banyak orang berkumpul di Seoul untuk menonton pertandingan tersebut secara langsung di layar raksasa.

Evolusi AI: Dampak Abadi AlphaGo

Kesuksesan AlphaGo bukanlah peristiwa yang berdiri sendiri. Hal ini meletakkan dasar bagi sistem AI modern, termasuk model bahasa besar (LLM). Prinsip intinya tetap sama: melatih jaringan saraf untuk memprediksi elemen berikutnya (gerakan atau kata) berdasarkan data yang ada, kemudian menyempurnakan model tersebut menggunakan pembelajaran penguatan untuk menyelaraskannya dengan tujuan tertentu.

Kunci untuk mencapai kemajuan, seperti yang ditunjukkan oleh AlphaGo, bukan hanya algoritma yang cerdas tetapi juga memiliki data yang cukup untuk pra-pelatihan dan sinyal imbalan yang jelas untuk pasca-pelatihan. Tanpa bahan-bahan ini, inovasi teknis tidak akan cukup.

Elemen Manusia

Kemenangan atas Lee Sedol sungguh pahit. Sedol sendiri meminta maaf kepada umat manusia atas kehilangannya, menyebutnya sebagai kegagalannya, bukan kegagalan mereka. Tradisi tinjauan pasca-pertandingan, yang merupakan landasan budaya Go, tidak mungkin dilakukan karena AlphaGo bukan manusia. Tim menyaksikan teman-teman Sedol turun tangan untuk mengisi kekosongan tersebut, namun hal tersebut tidak sama.

Pada akhirnya, AlphaGo adalah produk dari upaya kolektif, sebuah “suku” yang membangun artefak yang mampu melampaui keterampilan manusia dalam permainan yang kompleks. Tujuan Go mungkin adalah untuk menang, namun tujuannya juga mencakup hiburan dan eksplorasi, memastikan bahwa bahkan dengan dominasi AI, keterlibatan manusia akan tetap bertahan.