Kecerdasan buatan Hanabi Facebook memberikan hasil canggih

Penelitian AI Facebook (FAIR) mengatakan bahwa ia telah menciptakan AI terbaru untuk mencapai kinerja puncak dengan memainkan permainan kartu Hanabi. Sistem AI mencapai skor 24,61 dari 25, sedangkan preseden terbaik mendapat 23,92 dari 25. Pada bulan Februari, peneliti Google, DeepMind, Universitas Carnegie Mellon dan Universitas Oxford memiliki mengusulkan referensi Hanabi dan penciptaan lebih banyak kecerdasan buatan yang dapat memainkan permainan untuk mencapai "perbatasan baru untuk penelitian kecerdasan buatan".

Tidak seperti tantangan game lainnya yang mengadu kecerdasan buatan terhadap manusia, seperti catur atau Go, Hanabi adalah koperasi di mana para peserta bermain bersama untuk bekerja menuju tujuan bersama.

"Salah satu hal yang sangat mengasyikkan tentang hal ini adalah bahwa peningkatan yang kami lihat benar-benar ortogonal bagi peningkatan yang terlihat dengan pembelajaran penguatan yang dalam: Anda dapat menambahkan bahwa selain strategi, dan ini akan membuatnya lebih kuat, "kata Noam Brown, peneliti AI Facebook, di VentureBeat selama wawancara telepon." Kami menemukan bahwa hasilnya jauh melampaui ini. yang kami atau peneliti lain harapkan. Faktanya, manfaat yang kami peroleh dari penelitian ini lebih kuat daripada yang telah dicapai melalui semua algoritma pembelajaran penguatan mendalam yang telah digunakan di masa lalu.

Facebook Hanabi AI menarik beberapa kecerdasan pencariannya dari Pluribus, sebuah poker berbantuan Facebook yang diperkenalkan awal tahun ini yang mengalahkan beberapa juara manusia .

[1945901] 0]

Tim Facebook AI telah mencapai prestasi dengan menerapkan penelitian teknis dalam kombinasi dengan pembelajaran penguatan yang mendalam. Algoritma pencarian mengubah masalah menjadi parameter agen tunggal dengan memastikan bahwa semua agen kecuali satu menerapkan strategi yang disepakati, algoritma pembelajaran penguatan yang disebut rencana induk. Rencana tersebut memungkinkan peneliti untuk "memperlakukan kebijakan yang diketahui oleh agen lain sebagai bagian dari lingkungan dan mempertahankan kepercayaan tentang informasi tersembunyi berdasarkan tindakan orang lain," menurut sebuah artikel tentang subjek berjudul "Meningkatkan Kebijakan Melalui Penelitian di Permainan Koperasi yang Dapat Diobservasi Sebagian."

Pada akhirnya, peneliti Facebook percaya bahwa AI yang mirip dengan bot Hanabi-nya dapat membantu sistem robot, kendaraan otonom, atau agen AI percakapan untuk merespons masalah dengan lebih baik. aktivitas manusia dengan memecahkan "teori pikiran" menantang, kata Brown. Teori pikiran adalah ide menempatkan diri Anda di tempat orang lain untuk menyimpulkan tindakan selanjutnya. Contoh dari ini di dunia nyata adalah bahwa jika Anda mengemudi dan mobil di depan Anda berhenti, Anda dapat menyimpulkan atau menyimpulkan bahwa seseorang akan memasuki persimpangan pejalan kaki bahkan jika Anda tidak bisa melihatnya.

"Itu adalah sesuatu yang datang secara alami kepada manusia, gagasan untuk menempatkan diri pada posisi orang lain dan memahami mengapa mereka mengambil langkah yang mereka ambil, apa yang mereka lakukan. Mereka berpikir, dan bahkan jika mereka tidak tahu hal-hal tertentu. Tapi itu adalah sesuatu yang AI selalu perjuangkan, "katanya. "Telah ada perdebatan panjang tentang apakah primata memiliki teori pikiran dan pada usia berapa bayi manusia mengembangkan teori pikiran, dan saya pikir begitu? sangat menarik untuk akhirnya melihat perilaku semacam ini dalam AI dan saya pikir itu akan sangat penting jika kita ingin menyebarkan AI di dunia nyata untuk berinteraksi dengan manusia karena manusia tunggu perilaku ini. "

Dalam informasi lain tentang gameplay dan AI, minggu lalu, master Go Lee Sedol mengatakan bahwa ia berencana untuk menarik diri dari permainan. Sedol mengalahkan AlphaGo dari DeepMind satu kali dalam lima seri permainan terbaik pada tahun 2016, tetapi berencana untuk pensiun karena munculnya manusia super AI yang "tidak tidak dapat dikalahkan ", menurut BBC [19459004

Leave a Reply

Your email address will not be published. Required fields are marked *

*