Poker Baru AI Lebih Cepat, Lebih Kuat Daripada Versi Terakhir yang Tidak Terkalahkan

Peneliti di Fb menerbitkan a kertas minggu lalu di AI poker baru yang tampaknya paling canggih hingga saat ini dan yang memiliki risiko terbesar namun melibatkan poker on-line bermain.

Mirip dengan program AlphaZero yang telah merevolusi dunia catur sampai batas tertentu, bot baru yang disebut ReBeL (kependekan dari Recursive Perception-based Studying) dapat mencapai kinerja manusia tremendous di head-up maintain'em tanpa batas melalui “belajar penguatan permainan mandiri” "

Bot tampaknya lebih kuat dari Poker 2019 AI disebut Pluribus. Versi AI poker telah mampu mengalahkan pemain manusia terbaik dalam bertahan tanpa batas sejak tahun 2017, ketika seseorang bernama Libratus menurunkan sekelompok professional poker elit.

Tidak seperti catur, poker adalah permainan di mana pemain tidak memiliki akses ke semua informasi penting. Dua kartu gap tidak diketahui. Poker dianggap "permainan informasi yang tidak sempurna." Menurut koran itu, AI belajar mandiri sebelumnya memiliki masalah dengan permainan seperti poker.

Pekerjaan tersebut berasal dari Noam Brown, Anton Bakhtin, Adam Lerer, dan Qucheng Gong di Fb.

"Tujuan kami dalam makalah ini bukan untuk mengejar kinerja canggih dengan cara apa pun yang diperlukan," tulis mereka. “Sebaliknya, tujuan kami adalah mengembangkan algoritma yang sederhana, fleksibel, dan efektif yang memanfaatkan pengetahuan area pakar sesedikit mungkin. Hasil eksperimental menunjukkan bahwa meskipun sederhana, ReBeL efektif dalam permainan dua-pemain zero-sum zero-imperfect-information informasi dan mengalahkan profesional manusia papan atas dengan signifikansi statistik dalam permainan tolok ukur poker maintain'em Texas head-up tanpa batas Texas Maintain'em saat menggunakan pengetahuan area yang jauh lebih sedikit ahli daripada AI poker sebelumnya. "

Google's AlphaZero, yang mirip dengan ReBeL, belum lama ini membakar dunia catur dengan gaya permainannya yang menyerang tanpa henti, yang menyiratkan pemahaman yang lebih dalam tentang permainan itu. Tampaknya ReBeL juga bisa meningkatkan standar untuk poker, meskipun dengan cara yang tampaknya tidak bisa dibedakan dengan pemain manusia.

Keuntungan bermain sendiri?

Sementara ReBeL mencapai apa yang disebut sebagai kinerja "manusia tremendous" dalam penahanan tanpa batas, itu bukan poker AI pertama yang mencapai tingkat itu. Bot sebelumnya memiliki, tetapi ReBeL tampaknya menandai peningkatan penguasaan ilmu komputer atas poker, menurut surat kabar.

Makalah ini membuat banyak referensi untuk ReBeL menjadi cepat – sangat cepat. Itu belajar bermain poker tanpa cara pintas yang dihitung sebelumnya atau informasi yang dibundel tentang cara bermain poker tanpa dieksploitasi.

Dalam pertandingan melawan poker professional Dong Kim, ReBeL "bermain lebih cepat dari 2 detik per tangan dan tidak pernah membutuhkan lebih dari 5 detik untuk sebuah keputusan," kata surat kabar itu.

Itu juga mengalahkan Kim lebih meyakinkan daripada AI sebelumnya, lebih dari ukuran sampel 7.500 tangan.

Kecepatan ReBeL memungkinkannya serbaguna di berbagai ukuran tumpukan. ReBeL "dilatih untuk semua ukuran tumpukan antara 5.000 dan 25.000 chip, bukan hanya standar 20.000," kata surat kabar itu. Penekanan di sini adalah pada semua ukuran tumpukan. Ini tampaknya membuat ReBeL menjadi ancaman yang lebih besar terhadap integritas permainan poker on-line karena pemain membeli dan bermain dengan jumlah sewenang-wenang, yang juga berfluktuasi selama permainan karena chip dimenangkan dan hilang.

"Risiko paling cepat yang ditimbulkan oleh karya ini adalah potensinya untuk berselingkuh dalam permainan rekreasi seperti poker," tulis para peneliti. “Walaupun algoritma AI sudah ada yang dapat mencapai kinerja manusia tremendous dalam poker, algoritma ini umumnya mengasumsikan bahwa peserta memiliki sejumlah chip tertentu atau menggunakan ukuran taruhan tertentu. Pelatihan ulang algoritma untuk memperhitungkan tumpukan chip sewenang-wenang atau ukuran taruhan yang tidak terduga membutuhkan lebih banyak perhitungan daripada yang layak secara actual time. Namun, ReBeL dapat menghitung kebijakan untuk ukuran tumpukan arbitrer dan ukuran taruhan arbitrer dalam hitungan detik. Sebagian karena alasan ini, kami telah memutuskan untuk tidak merilis kode untuk poker. ”

Jika ReBeL duduk di meja permainan uang poker langsung, kecepatannya tidak akan berarti – kecuali, tentu saja, itu bisa memanggil jam lawannya. Poker AI tidak secanggih itu. Namun, dengan poker on-line, di mana pemain memiliki waktu terbatas untuk membuat keputusan, kecepatan adalah kekuatan. Kecepatan bermain ReBeL dalam pertandingan melawan pemain manusia dapat menyebabkan pemain itu membuat lebih banyak kesalahan.

Dapatkan Pembaruan Taruhan On-line On line casino dan Olahraga NJ

Berlangganan untuk mendapatkan berita taruhan kasino dan olahraga NJ on-line terbaru ke kotak masuk Anda.

Terima kasih telah berlangganan.

Ada yang salah.