DeepMind AI mencapai status Grandmaster di Starcraft 2

By | October 30, 2019

Hak cipta gambar
Badai Salju

Keterangan foto

DeepMind mengatakan bahwa Starcraft 2 adalah permainan yang "melampaui batas kecerdasan manusia"

DeepMind menyatakan bahwa mereka menciptakan kecerdasan buatan pertama untuk mencapai turnamen teratas dari salah satu permainan video olahraga paling populer.

Dikatakan Starcraft 2 merupakan tantangan AI yang lebih menantang daripada catur dan permainan lainnya sebagian karena karya-karya lawan sering tidak terlihat.

Penerbitan di jurnal peer-review Nature memungkinkan laboratorium yang berbasis di London untuk menuntut tonggak sejarah baru.

Tetapi beberapa gamer profesional memiliki perasaan campur aduk tentang menegaskan posisi Grandmaster.

DeepMind – dimiliki oleh perusahaan induk Google Alphabet – mengatakan pengembangan AlphaStar akan membantunya mengembangkan alat AI lain yang pada akhirnya bermanfaat bagi umat manusia.

"Salah satu hal penting yang kami sangat nikmati adalah Starcraft menghadirkan banyak tantangan yang sebenarnya Anda temui dalam masalah dunia nyata," kata Dave Silver, kepala Kelompok belajar laboratorium terkonsolidasi.

"Kami melihat Starcraf Sebagai bidang standar untuk memahami ilmu AI dan bergerak maju dalam upaya kami membangun sistem AI yang lebih baik."

DeepMind mengatakan bahwa contoh-contoh teknologi yang suatu hari dapat mengambil manfaat dari wawasan baru termasuk robot, mobil self-driving dan asisten virtual, yang semuanya perlu membuat keputusan. pengamatan tidak sempurna ".

Bagaimana Anda bermain Starcraft 2?

Dalam pertandingan satu lawan satu, dua pemain bersaing satu sama lain setelah memilih ras asing. Masing-masing dari tiga opsi – Zerg, Protoss dan Terran – memiliki kemampuan yang berbeda.

Pemain mulai dengan hanya beberapa bagian dan harus mengumpulkan sumber daya – mineral dan gas – yang dapat digunakan untuk membuat bangunan baru dan membuat teknologi. Mereka juga dapat menginvestasikan waktu untuk meningkatkan jumlah unit pekerja mereka.

Hak cipta gambar
DeepMind

Keterangan foto

Tujuan dari Starcraft 2 adalah untuk mengalahkan pihak lain, yang biasanya dilakukan dengan menghancurkan bangunannya

Gamer hanya dapat melihat sebagian kecil peta pada satu waktu dan mereka hanya bisa mengarahkan "kamera" dalam game ke suatu area jika beberapa unit mereka ada di sana atau sudah melakukan perjalanan pergi kesana

Saat siap, pemain dapat mengirim tim pengintai untuk mengungkap persiapan musuh atau sebaliknya langsung dan melakukan serangan.

Semua ini terjadi secara real time dan pemain tidak melakukan putaran untuk bergerak.

Seiring akselerasi yang semakin cepat, gamer seringkali harus menyulap ratusan unit dan struktur, dan membuat pilihan yang hanya bisa menghasilkan setelahnya.

Bagian dari tantangannya adalah banyaknya pilihan yang ditawarkan.

Kapan saja, ada 100 triliun triliun kemungkinan gerakan, dan ribuan pilihan seperti itu harus dibuat sebelum menjadi jelas bahwa itu telah membanjiri bangunan dan untuk menang.

Bagaimana DeepMind mendekati masalah?

DeepMind melatih tiga jaringan saraf terpisah – satu untuk setiap ras alien yang dimainkannya.

Untuk memulainya, ia telah menyusup ke dalam database game yang luas yang disediakan oleh pengembang Blizzard of Starcraft. Ini digunakan untuk melatih agen mereka untuk meniru gerakan pemain terkuat.

Salinan agen-agen ini kemudian diadu satu sama lain untuk mengasah keterampilan mereka melalui teknik yang disebut penguatan pembelajaran.

Mereka juga menciptakan "agen penambangan", yang misinya adalah untuk mengekspos kelemahan dari strategi aktor utama, untuk memungkinkan mereka menemukan cara untuk mengatasinya.

Hak cipta gambar
DeepMind

Keterangan foto

DeepMind memperlambat kecepatan Alphastar dapat mengendalikan bagian-bagiannya untuk mengatasi kritik sebelumnya bahwa itu adalah manusia super.

Mr. Silver menyamakan agen-agen tambahan ini dengan "mitra satu sama lain" dan mengatakan bahwa mereka memaksa agen utama untuk mengadopsi strategi yang lebih kuat daripada dalam kasus lain.

Semua ini memakan waktu 44 hari. Tetapi karena prosesnya dilakukan dengan kecepatan tinggi, itu mewakili sekitar 200 tahun bermain game manusia.

Tiga jaringan saraf kemudian diadu melawan pemain pada platform Battle.net Blizzard, tanpa diungkapkan sampai setelah setiap pertandingan, untuk melihat apakah mereka menang. tidak

Apa hasilnya?

Laboratorium itu mengatakan jaringan sarafnya mencapai status Grandmaster untuk masing-masing dari tiga ras alien – pangkat yang diberikan kepada pemain top di setiap wilayah di dunia.

Tapi mereka mengakui masih ada sekitar 50 hingga 100 orang di depan AlphaStar di Battle.net.

Apakah ini benar-benar tentang mengembangkan AI untuk bertarung?

DeepMind memiliki komitmen untuk tidak pernah mengembangkan teknologi untuk senjata otonom yang mematikan. Tn. Silver mengatakan pekerjaan di Starcraft 2 tidak mengubah itu.

"Dapat dikatakan bahwa ini memiliki semua jenis penggunaan militer yang mengatakan tidak lebih dari mengatakan AI untuk catur dapat digunakan untuk mengarah ke aplikasi militer," tambahnya. .

"Tujuan kami adalah mencoba dan membangun kecerdasan untuk tujuan bersama [but] dengan pertanyaan etis yang lebih dalam yang harus dijawab oleh masyarakat."

] DeepMind mengalahkan pemain Go Korea pada tahun 2016, militer Tiongkok menerbitkan sebuah dokumen yang menyatakan bahwa pencapaian ini menggarisbawahi "potensi besar kecerdasan buatan dalam komando tempur". .

Beijing kemudian mengumumkan niatnya untuk melampaui Amerika Serikat dan menjadi Pemimpin Dunia dalam AI pada tahun 2030.

Apa yang dipikirkan gamer?

Raza "RazerBlader" Sekha adalah salah satu dari tiga ahli Starcraft 2 top Inggris. Dia bermain sebagai Terran melawan AlphaStar dan juga menonton pertandingannya dengan orang lain.

Dia mengatakan bahwa jaringan saraf "mengesankan", tetapi berpikir itu masih memiliki keanehan.

"Ada permainan di mana seseorang menciptakan karya yang sangat aneh [army] terdiri dari unit udara murni – dan AlphaStar tidak benar-benar tahu bagaimana menjawabnya," dia ingat.

"Itu tidak beradaptasi dengan permainannya dan akhirnya kalah.

" Itu menarik karena pemain yang baik sering memainkan gaya yang lebih standar, sementara mereka adalah pemain yang lebih lemah yang sering bermain aneh. "

Joshua" RiSky "Hayward adalah pemain top di Britania Raya.

Dia tidak diizinkan bermain AlphaStar tetapi melakukan penelitian. permainan yang dimainkannya seperti Zerg. Dia percaya bahwa perilakunya tidak lazim bagi seorang Grandmaster.

"Itu biasanya tidak menciptakan strategi yang paling efektif, paling efektif" dia berkomentar, "tapi hebat dalam menjalankan strateginya dan melakukan banyak hal pada saat yang sama, jadi saya masih mencapai tingkat yang baik.

Hak cipta gambar
DeepMind

Keterangan foto

Tangkapan layar ini menunjukkan agen utama melawan agen pertambangan, yang mengungkapkan kelemahan dengan membangun unit berjubah.

"Ketika AI lebih baik dari pemain catur, ia melakukannya dengan membuat gerakan abnormal terakhir lebih kuat dari para pemain. Saya merasa DeepMind membutuhkan lebih banyak waktu untuk melakukan perubahan. baru dan akan sedikit mengecewakan jika proyek tidak berlanjut. "

Apakah DeepMind sebelumnya menunjukkan bahwa AI tidak perlu belajar dari manusia?

Versi "Tidak" dari Catur, Go, dan Shogi di laboratorium Agen permainan sebenarnya bekerja lebih baik ketika mereka hanya mengandalkan pembelajaran intensif.

Tetapi DeepMind mengatakan Starcraft 2 terlalu rumit untuk realistis, setidaknya untuk saat ini.

tanpa panduan apa pun akan menjadi "jarum dalam masalah jerami," kata Silver, dengan agen yang diminta tersandung dalam serangkaian langkah dengan hasil yang bermanfaat.

Hak cipta gambar
DeepMind

Keterangan foto

Dave Silver – di sebelah kanan – mengatakan Starcraft 2 dianggap sebagai game yang menguji kemampuan manusia

"Anda harus melakukan banyak hal mustahil, masing-masing terlihat sangat buruk dari tempat Anda berada," jelasnya.

"Kami menyebutnya masalah eksplorasi.

" Masih ada pertanyaan penelitian terbuka, tentang bagaimana melakukan sesuatu seperti AlphaStar Zero, yang dapat diajarkan sepenuhnya dengan sendirinya. tanpa data manusia. "

Apa selanjutnya?

DeepMind mengatakan berharap teknik yang digunakan untuk mengembangkan Alphastar pada akhirnya akan membantunya" berakhir dorong penelitian kami ke bidang dunia nyata. "

Tetapi Tuan Silver mengatakan lab" dapat beristirahat saat ini ", alih-alih mencoba membawa AlphaStar ke tingkat berikutnya. pemain yang sangat elit.

Leave a Reply

Your email address will not be published. Required fields are marked *