Pemain Amatir Baru Saja Menang Melawan Poker Profesional

AI hanya menjamin kemenangan game lainnya atas orang-orang dengan memenangkan kompetisi poker 20 hari. AI, yang disebut Libratus, naik melawan empat pemain terbaik Texas Heads-Up No-Limit Texas Hold Them di sebuah klub Pennsylvania. Setelah 120.000 tangan, Libratus menang dengan keunggulan lebih dari $ 1,7 juta chip.

“Saya merasa luar biasa,” kata Tuomas Sandholm, seorang peneliti PC di Carnegie Mellon University yang merupakan bagian dari kelompok yang membuat AI. “Ini adalah kisah David versus Goliat, dan Libratus bisa melempar batu.”

AI yang memiliki kemampuan poker sangat penting karena poker adalah putaran “data yang tidak benar”: pemain tidak menyadari kartu apa yang dimiliki lawan mereka, jadi tidak pernah memiliki perspektif penuh tentang kondisi permainan. Ini berarti AI perlu mempertimbangkan bagaimana saingannya bermain dan merevisi pendekatannya sehingga tidak memberikan saat ia memiliki tangan yang layak atau berpura-pura.

“Ini adalah titik balik yang benar-benar penting untuk kemampuan otak buatan manusia,” kata Georgios Yannakakis di University of Malta. “Ini menyerupai kenyataan. Kenyataan saat ini adalah sesi data yang tidak jelas, jadi dengan menciptakan poker online, kita bisa sedikit mendekati pertimbangan komputer yang umum.”

Perhitungan Libratus tidak khusus untuk poker, atau bahkan hanya untuk rekreasi. AI belum mendidik prosedur apa pun dan lebih suka menggunakan cara spesifiknya untuk bermain sesuai dengan data yang diberikan – untuk situasi ini, standar poker. Ini berarti Libratus dapat dihubungkan ke keadaan apa pun yang memerlukan reaksi karena data yang rusak.

“Ada aplikasi di dunia maya, transaksi, pengaturan militer, penjualan dan langit adalah batas dari sana,” kata Sandholm. Laboratoriumnya juga sangat menyukai bagaimana AI dapat mendukung pertempuran melawan kontaminasi, dengan meninjau ulang rancangan perawatan sebagai prosedur pengalihan perhatian. “Anda dapat mengetahui bagaimana cara melawan penyakit dengan lebih baik terlepas dari apakah Anda tidak memiliki obat tambahan yang tersedia untuk Anda – Anda hanya memanfaatkannya lebih cemerlang,” kata Sandholm.

Membiarkan kucing keluar dari tas anda

Kelompok Carnegie Mellon sebelumnya telah membungkam strategi Libratus, mengharapkan klarifikasi dapat membantu pesaingnya. Jadilah seperti itu, sekarang Sandholm akan mengatakan lebih banyak tentang bagaimana fungsinya.

Libratus memiliki tiga bagian utama. Yang pertama tidak banyak berubah sejak tahun 2015 ketika kelompok Sandholm awalnya memasuki AI dalam kompetisi komparatif melawan pemain mahir (pada saat itu, orang menang). Bagian ini mencatat banyak teknik yang bisa digunakan AI saat bermain dimulai. Pada awal kompetisi, Libratus telah menghabiskan apa yang mungkin bisa disebut perhitungan 15 juta jam untuk mengasah tekniknya.

Bagian kedua, sekarang benar-benar ditingkatkan oleh Sandholm dan PhD. PhD-nya Noam Brown, berusaha untuk meningkatkan prosedur Libratus dengan masing-masing tangannya. Disebut “pemecah endgame”, hal itu dianggap sebagai “kesalahan” yang dilakukan musuh AI – contoh di mana mereka membersihkan diri dari ancaman penyalahgunaan – untuk meramalkan konsekuensi dari masing-masing pihak. Kelompok tersebut tidak dapat mengetahui dari investigasi terukur jika bentuk pemecah masalah sebelumnya meningkatkan permainan AI oleh imajinasi, kata Sandholm. “Bagaimanapun, yang baru ini baru-baru ini hebat.”

Bagian terakhir dari AI mencari kekurangan khusus tertentu sehingga bisa mengubah cara bermainnya sebelum sesi berikut. Hal ini mencoba untuk membedakan hal-hal yang disalahkan oleh saingannya, misalnya, sebuah hadiah yang “memberitahu” bahwa pemain lain telah mencatatnya.

Ini sangat penting karena, dalam kompetisi terakhir, pemain manusia dapat mengetahui bagaimana AI dimainkan saat kartu itu beragam dan mengubah cara mereka bertaruh dengan cara yang sama.

Lebih sulit dimainkan setiap hari

“Ini sangat hebat saat ini – sangat mencengangkan,” kata Jason Les, salah satu pemain ahli, saat kompetisi memasuki hari-hari terakhir. “Tampaknya ada jenis teknik refresh segment yang mencari tahu bagaimana cara terbaik untuk bermain. Sistemnya oleh semua akun meningkat dalam jangka panjang dan ini lebih sulit dan lebih kuat secara konsisten.”

Terlepas dari nasib buruk mereka, para pemain ahli akan membagi-bagikan pot hadiah $ 200.000 berdasarkan pameran mereka – dan para ilmuwan tidak akan benar-benar membawa pulang imbalan apa pun. Setelah kemenangannya, kelompok Libratus bermaksud untuk mendistribusikan perhitungan AI dalam catatan harian yang diasosiasikan.

Masih jauh sebelum AI bisa melawan kenyataan sekarang, kata Simon Lucas di University of Essex, Inggris. “Kenyataannya, Anda sering memiliki jumlah keputusan yang jauh lebih besar daripada pada hiburan kartu. Hasil yang mungkin lebih terbuka lagi,” katanya.

Bagaimanapun, ini adalah pencapaian yang luar biasa karena poker dan domino 99 adalah hiburan yang membingungkan, katanya. “Ini kemajuan maju yang patut dicatat dan sebuah cobaan berat.”