playbot โป๊กเกอร์ใหม่ทั้งหมดได้รับการพัฒนาโดยนักวิจัยกลุ่มเดียวกันกับที่ประกาศ Libratus ในปี 2017 ครั้งนี้เราประสบความสำเร็จในการเอาชนะทีมผู้เล่นโป๊กเกอร์ชั้นนำในเกม NLHE 6 มือ Facebook ร่วมมือกับนักวิจัยจากมหาวิทยาลัย Carnegie Mellon ซึ่งนำโดยศาสตราจารย์ Tuomas Sandholm ของ CMU และ Noam Brown นักศึกษาระดับบัณฑิตศึกษาของเขา เขากำลังวางแผนการประลองระหว่างซูเปอร์คอมพิวเตอร์โป๊กเกอร์ AI รุ่นล่าสุดที่ชื่อว่า “Pluribus” กับผู้เล่นโป๊กเกอร์ชั้นนำของอุตสาหกรรม และผลการวิจัยที่ตีพิมพ์ในวารสาร Science เมื่อต้นเดือนนี้ก็เป็นที่น่าสังเกต บอทสามารถเอาชนะศัตรูได้ด้วยสิ่งที่ AI อื่น ๆ ไม่สามารถทำได้มาก่อน (โปรแกรม AI ก่อนหน้านี้สามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) ผลลัพธ์ของโครงการนี้คาดว่าจะมีผลกระทบอย่างมากต่อการวิจัย AI และเกมโป๊กเกอร์เอง Two TrialsPoker ถือเป็นเกมที่รวบรวมความท้าทายของข้อมูลที่ซ่อนอยู่ได้เป็นอย่างดีจนนักวิจัยใช้เป็นความท้าทายในการสร้างและพัฒนาปัญญาประดิษฐ์ อย่างไรก็ตามจนถึง Pluribus ไม่มีเครื่องจักรใดประสบความสำเร็จในการเอาชนะผู้เล่นที่เป็นมนุษย์ในการตั้งค่า No Limit Texas Hold’em แบบผู้เล่นหลายคน (รูปแบบที่นิยมมากที่สุดสำหรับการเล่นโป๊กเกอร์) Pluribus ต่อสู้กับผู้เชี่ยวชาญโป๊กเกอร์ที่ดีที่สุดในรูปแบบ 6 Max NLHE Pro เป็นผู้เชี่ยวชาญสูงสุด 6 คนและมีรายได้อย่างน้อย 1 ล้านเหรียญในอาชีพโป๊กเกอร์มืออาชีพของเขา พลูริบัสผ่านการทดสอบที่แตกต่างกันสองครั้ง ในการทดลองครั้งแรกมนุษย์ห้าคนและ AI (5H + 1AI) หนึ่งคนเข้าร่วมกัน แต่ในการทดลองครั้งที่สองอนุญาตให้มีมนุษย์เพียงคนเดียวเท่านั้นโดยพิจารณาว่าไม่อนุญาตให้บอทต้องเผชิญกับร่างโคลนของพลูริบัส 5 ตัว (1H + 5AI) . ฉันสื่อสารและไม่รู้ว่าฉันกำลังเล่นกับใครดังนั้นฉันจึงป้องกันการสมรู้ร่วมคิด Pluribus ชนะผลการทดลองทั้งสองครั้งพบว่า Pluribus ชนะสูงกว่าผู้เล่นโป๊กเกอร์ที่เป็นมนุษย์ ในบรรดาผู้เล่นที่เข้าร่วมการทดลอง ได้แก่ Anthony Gregg, Don Kim, Greg Merson, Jacob Tool, Jason Les, Jimmy Chow, Linus Leliger, Michael Galliano, Nick Petrangelo และ Sean Luang, Seth Davies, Trevor Savage ใช้ชื่อเล่นของคุณในระหว่างการเล่น ในการทดลอง 5H + 1AI มีการเล่นทั้งหมด 10,000 มือใน 12 วันและในการทดสอบ 1H + 5AI ผู้เล่นโป๊กเกอร์ Darren Elias และ Chris Ferguson เล่น 5,000 มือต่อสำเนา Pluribus 5 เล่ม เมื่อรวมผลลัพธ์แล้วบล็อกโพสต์ Facebook AI ของ Noam Brown พบว่าบอทสามารถเอาชนะมนุษย์ได้ประมาณ 5 ดอลลาร์ต่อการเคลื่อนไหวและประมาณ 1,000 ดอลลาร์ต่อชั่วโมง Pluribus vs Pro Video Demonstration: ข้อดีของโป๊กเกอร์คิดอย่างไรกับ AI Pluribus ผู้เข้าร่วมในการทดลองแสดงความคิดเห็นเกี่ยวกับบอทโป๊กเกอร์ล่าสุด: Seth Davies: “สิ่งที่น่าตื่นเต้นที่สุดในการเล่นกับ Pluribus คือการจัดการกับกลยุทธ์พรีฟล็อปที่ซับซ้อนซึ่งแตกต่างจากมนุษย์ Pluribus ใช้พรีฟล็อปขนาดใหญ่หลายตัวการตอบสนองต่อช่วงเป็นความท้าทายที่สนุกสนานแตกต่างจากเกมของมนุษย์” Jason Les: “มันเป็นมอนสเตอร์บลัฟแน่นอนฉันคิดว่ามันเป็นการบลัฟที่มีประสิทธิภาพมากกว่ามนุษย์ส่วนใหญ่นั่นเป็นสาเหตุที่ทำให้การจับคู่ยากมากคุณอยู่ภายใต้แรงกดดันอย่างมากต่อ AI ฉันรู้ว่าคุณเป็นไปได้มาก “กำลังพูดคุยกันอยู่ที่นี่” Jimmy Chow: “เมื่อใดก็ตามที่ฉันเล่นบอทฉันรู้สึกว่าได้รับสิ่งใหม่ ๆ เพื่อรวมเข้ากับเกมในฐานะมนุษย์เราทำให้เกมง่ายขึ้นฉันคิดว่ามันมีแนวโน้มที่จะนำกลยุทธ์มาใช้และทำให้มันเป็น จำได้ง่ายขึ้นไม่ต้องใช้บอทเป็นหนึ่งในทางลัดเหล่านี้และมีโครงสร้างเกมที่ซับซ้อนและสมดุลสำหรับการตัดสินใจทุกครั้งคริสเฟอร์กูสัน: “Pull Rivas เป็นคู่ต่อสู้ที่ยากมากที่จะเล่นกับมันยากที่จะตรึง เขาด้วยมือข้างใดก็ได้นอกจากนี้เขายังเก่งในการเดิมพันมูลค่าเล็กน้อยในแม่น้ำเขาเก่งมากฉันเก่งมากที่ได้รับคุณค่าจากความดีของเขามือ “ดาร์เรนเอเลียส:” เป็นแค่ฉันและฉันก็เล่น นับพันมือทุกวันในห้าเวอร์ชันของบอทโป๊กเกอร์ AI นี้มันดีมากมันพัฒนาขึ้นอย่างรวดเร็วและเปลี่ยนจากผู้เล่นระดับปานกลางไปสู่การเป็นผู้เล่นโป๊กเกอร์ระดับโลกในไม่กี่วันถึงสองสามสัปดาห์สิ่งนี้ค่อนข้างน่ากลัว “สรุป Pull Ribas ตอนนี้อย่างไรก็ตามไม่ใช่เรื่องเกินจริงที่จะกล่าวว่าหนึ่งในผู้เล่นโป๊กเกอร์ที่ดีที่สุดในโลกไม่มีหน้าโป๊กเกอร์ แกนหลักของ Pluribus หรือกลยุทธ์พิมพ์เขียวสร้างขึ้นจากการเล่นเองหรือแข่งขันกับร่างโคลนของตัวเอง นี่เป็นวิธีเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมเครือข่ายประสาทเทียม 5 เครือข่ายที่ฝึกฝนมานาน 45,000 ปีและสามารถเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 ได้ พลูริบัสสอนตัวเองตั้งแต่เริ่มต้นโดยใช้ประเภท การเรียนรู้แบบเสริมกำลังดำเนินการในลักษณะเดียวกับ AlphaZero ที่ GoAI ของ DeepMind ใช้ เริ่มต้นด้วยการเล่นโป๊กเกอร์แบบสุ่มและปรับปรุงเมื่อคุณตัดสินใจว่าการกระทำใดจะทำเงินได้มากขึ้น หลังจากแต่ละมือจะจดจำวิธีการเล่นและพิจารณาว่ามันทำเงินได้มากขึ้นหรือไม่ด้วยการกระทำต่างๆเช่นการเพิ่มแทนที่จะยึดติดกับการเดิมพัน หากทางเลือกอื่นนำไปสู่ผลลัพธ์ที่ดีกว่าคุณมักจะเลือกทางเลือกนั้นในอนาคต Pluribus ได้พัฒนากลยุทธ์พื้นฐานเพื่อทำตามในเกมโดยการเล่นโป๊กเกอร์หลายล้านล้านมือกับตัวเอง ทุกครั้งที่พลูริบัสทำการตัดสินใจจะเปรียบเทียบสถานะของเกมกับพิมพ์เขียวและทำนายการเคลื่อนไหวบางอย่างเพื่อดูว่าเกมดำเนินไปอย่างไร จากนั้นตัดสินใจว่าคุณสามารถปรับปรุงได้หรือไม่ Pluribus เรียนรู้ด้วยตัวเองโดยไม่มีการป้อนข้อมูลจากมนุษย์ดังนั้นจึงใช้กลยุทธ์บางอย่างที่ผู้เล่นที่เป็นมนุษย์จะไม่พิจารณาใช้ ความสำเร็จของพลูริบัสเกิดจากประสิทธิภาพเป็นหลัก เมื่อเล่นโป๊กเกอร์โดยมีหน่วยประมวลผลกลาง (ซีพียู) สองหน่วยซึ่งแตกต่างจาก 100 CPU ของ Libratus และ Go bot ดั้งเดิมของ DeepMind ซึ่งใช้ซีพียูประมาณ 2,000 ตัวในตอนแรกที่เอาชนะผู้เล่นระดับโปรชั้นนำมันจะถูกดำเนินการ เมื่อพลูริบัสเล่นกับตัวเองเขาเล่นมือในเวลาประมาณ 20 วินาที นี่เร็วกว่าผู้เล่นมืออาชีพประมาณสองเท่า สิ่งที่ยอดเยี่ยมอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์และมีราคาเพียง 144 เหรียญในการรัน จากการเปรียบเทียบ Libratus มีซูเปอร์คอมพิวเตอร์มูลค่า 9.65 ล้านดอลลาร์และมีราคาแพงมากในการรัน แน่นอนว่าการทดลองนี้ไม่ได้จบลงด้วยโป๊กเกอร์เพียงอย่างเดียว ความสามารถในการเอาชนะนักโป๊กเกอร์มืออาชีพที่ดีที่สุดในเกมหกมือถือเป็นชัยชนะที่ยิ่งใหญ่อย่างแน่นอน แต่พลังในการประมวลผลของมันแสดงให้เห็นว่ามันสามารถมีจุดประสงค์อื่นนอกเหนือจากทรัมป์ จากข้อมูลของ Brown ผลการวิจัยดังกล่าวสนับสนุนว่า AI สามารถทำงานได้ในระดับ “เหนือมนุษย์” ในสถานการณ์ที่ AI มีหลายวิชาและการเข้าถึงข้อมูลถูก จำกัด และเป็นระบบอัตโนมัติจากวาณิชธนกิจและกลยุทธ์การเจรจาซึ่งมีศักยภาพที่จะนำไปใช้ ทุกที่แม้ในเทคโนโลยียานยนต์ Pluribus กำลังเข้าร่วมอันดับของเกมเช่นหมากรุกและไป ในสองเกมนี้ผู้เล่นที่เป็นมนุษย์ที่ดีที่สุดในโลกจะแพ้ปัญญาประดิษฐ์ ที่มา: https: //science.sciencemag.org/content/early/2019/07/10/science.aay2400


คาสิโน ที่ดีที่สุด
คาสิโนufabet
คาสิโน ufabet
คาสิโน มาเก๊า
คาสิโน ปอยเปต ออนไลน์

Leave a Reply

Your email address will not be published. Required fields are marked *