Algoritma AI Dari Fb Dapat Memainkan Catur & Poker Dengan Kemudahan Setara


Dalam berita terbaru, tim peneliti di Fb telah memperkenalkan bot AI umum, Pemberontak yang dapat memainkan informasi sempurna, seperti catur dan permainan informasi yang tidak sempurna seperti poker dengan kemudahan yang sama, menggunakan pembelajaran penguatan. Seperti yang dikatakan perusahaan, ini adalah langkah besar untuk menciptakan algoritme AI umum yang dapat bekerja dengan baik di berbagai sport.

Para peneliti percaya bahwa algoritma ini akan memiliki aplikasi dunia nyata, termasuk menangani negosiasi, deteksi penipuan, dan bahkan keamanan siber.

Algoritma ReBeL

AlphaZero dari DeepMind dengan cepat menarik perhatian komunitas penelitian AI ketika dirilis pada tahun 2017. Program berbasis AI yang dapat memainkan sport seperti catur, shogi, dan Go tidak pernah terdengar, tapi AlphaZero berbeda karena menggunakan pembelajaran penguatan dengan penelusuran (RL + Penelusuran) untuk 'belajar sendiri' dengan meniru pemain kelas dunia.

Ada juga mannequin yang dirancang untuk memainkan permainan lain seperti poker. Misalnya, Fb, pada 2019, diperkenalkan Bot Pluribus yang berhasil mengalahkan ahli manusia dalam Maintain 'em enam pemain tanpa batas, yang merupakan format poker yang paling banyak dimainkan di dunia.



Namun, belum ada algoritme AI umum yang dirancang sedemikian rupa sehingga dapat memenangkan catur dan poker.

Bagi manusia, kami mengenali keduanya sebagai sport yang berbeda dalam arti luas. Namun, untuk sebuah mesin, ia mengklasifikasikan permainan seperti catur sebagai permainan informasi yang sempurna, di mana pemain mengetahui semua kemungkinan kejadian dan mengetahui atau dapat melihat gerakan pemain lain; permainan seperti poker diklasifikasikan sebagai permainan informasi yang tidak sempurna yang dibutuhkan pemain untuk menyeimbangkan semua hasil yang mungkin saat membuat keputusan dengan cepat.

Jadi, meskipun AlphaZero bekerja dengan baik untuk catur, ia rusak saat digunakan untuk permainan informasi yang tidak sempurna. Untuk mengatasi aspek ini, Fb kini telah memperkenalkan Recursive Perception-base Studying (ReBeL), yang menurut raksasa media sosial itu merupakan 'langkah besar menuju pembuatan algoritme AI yang lebih umum'.

ReBeL adalah peningkatan dari pembelajaran penguatan umum + algoritma Pencarian (juga digunakan oleh AlphaZero). Itu dibangun di atas mannequin sebelumnya seperti AlphaZero tetapi sekarang hadir dengan kemampuan tambahan untuk bermain sport seperti poker, di mana ia menilai peluang pemain lawan memiliki kartu tertentu, misalnya, sepasang ace.

ReBeL terbukti efektif dalam permainan informasi tidak sempurna dua pemain berskala besar dengan jumlah nol seperti poker. Kinerjanya dievaluasi pada dua permainan informasi yang tidak sempurna – Texas Maintain 'em head-up tanpa batas, suatu bentuk poker, dan Liar's Cube, permainan dadu' gertak-gertakan 'yang dimainkan dengan banyak bagian.


Tetap terhubung

Dapatkan pembaruan terkini dan penawaran relevan dengan membagikan e-mail Anda.


Saat bereksperimen, dalam kasus Texas Maintain'em head-up tanpa batas, ReBeL dapat mengalahkan pakar manusia dengan signifikansi statistik. Itu juga ditemukan bekerja dengan Liar's Cube, yang merupakan jenis informasi tidak sempurna lainnya permainan – dengan demikian menetapkan kemampuan mannequin sebagai kerangka umum. Fb sekarang implementasi open supply di Liar’s Cube untuk memungkinkan komunitas riset AI yang lebih luas mengembangkan hasil ini.

Lihat juga

Switch Uang_Photo-oleh-Alistair-MacRobert-on-Unsplash "loading =" lazy "measurement =" (max-width: 180px) 100vw, 180px "data-src =" https://analyticsindiamag.com/wp-content/ uploads / 2020/01 / Cash-Transfer_Photo-by-Alistair-MacRobert-on-Unsplash.jpeg "data-size =" auto "data-srcset =" https://analyticsindiamag.com/wp-content/uploads/2020/ 01 / Cash-Transfer_Photo-by-Alistair-MacRobert-on-Unsplash.jpeg 1500w, https://analyticsindiamag.com/wp-content/uploads/2020/01/Cash-Transfer_Photo-by-Alistair-MacRobert-on-Unsplash -20x13.jpeg 20w "/></a><br />
  </figure>
</div>
<h3 id=Membungkus

Sesuai Fb, ReBeL adalah AI pertama yang menggunakan RL + Search yang berfungsi dengan baik bahkan dengan sport dengan informasi yang tidak sempurna. Namun, ini juga memiliki beberapa batasan.

Pertama, jumlah kehebatan komputasi ReBeL sangat tinggi, terutama dalam konteks sport tertentu seperti Recon Chess. Dalam Recon atau Reconnaissance Chess, pemain tidak menyadari posisi bidak lawan dan harus bergantung pada 'tindakan penginderaan' tertentu untuk menentukan papan. Ini memiliki kedalaman strategis tetapi sangat sedikit pengetahuan umum.

Kedua, karena ReBeL bergantung pada mengetahui aturan permainan yang sebenarnya, ini mungkin berguna untuk Go dan poker di mana aturan dan imbalan terkait sudah diketahui sebelumnya. Namun, hal yang sama tidak dapat dikatakan untuk interaksi dunia nyata. Oleh karena itu, untuk saat ini, dapat dikatakan bahwa mekanisme ReBeL dan kesuksesannya hanya terbatas pada permainan zero-sum dua pemain, yang sedikit dan jarang dalam interaksi dunia nyata.

Terlepas dari kekurangannya, algoritme ini telah mencapai kinerja yang unggul di Texas Maintain'em head-up tanpa batas menggunakan pengetahuan ahli yang relatif jauh lebih sedikit. Menulis tentang kapabilitas dan harapan masa depan, Fb mengatakan dalam blognya, "… kami melihat ini sebagai langkah besar untuk mengembangkan teknik common untuk interaksi multi-agen, dan dengan demikian sebagai langkah menuju aplikasi dunia nyata yang kompleks seperti deteksi penipuan dan keamanan siber."


Jika Anda menyukai cerita ini, bergabunglah dengan kami Komunitas Telegram.


Selain itu, Anda dapat menulis untuk kami dan menjadi salah satu dari 500+ pakar yang telah menyumbangkan cerita di AIM. Bagikan milik Anda nominasi di sini.

Shraddha Goled

Saya seorang jurnalis dengan gelar pascasarjana di bidang teknik jaringan komputer. Saat tidak membaca atau menulis, orang dapat menemukan saya mencorat-coret sesuka hati.