James Grosjean จัดอันดับให้ฉันเป็นหนึ่งในโดรนของ Netflix ที่ชื่นชอบ The Queen’s Gambit (2020) แต่ฉันเป็นคนชอบเล่นหมากรุกมาตลอด ในช่วงที่ฉันเป็นนักเรียนฉันอาจจะกินครัวซองต์ช็อคโกแลตหนึ่งพันชิ้นในขณะที่ดูเมอร์เรย์เทิร์นบูลผู้สง่างามในจินตนาการ (หรือที่เรียกว่า“ เซียนหมากรุก”) เข้าครอบครองทุกคนที่อยู่ในจัตุรัสกลางเมือง -“ 2 ดอลลาร์คืนเงินหากคุณชนะหรือเสมอ” เพื่อเป็นเกียรติ ฉันต้องถ่ายภาพ Karpov อันยิ่งใหญ่ที่ล้อมรอบด้วยกระจกสีของห้องโถงอนุสรณ์เมื่อเขากำลังจำลองสถานการณ์ด้วยแผง 40 แผ่นในมหาวิทยาลัย ฉันเป็นส่วนหนึ่งของสื่อมวลชนของนักเรียนเมื่อคาสปารอฟกล่าวคำพูดที่ขัดแย้งกันในตอนนั้นว่าคอมพิวเตอร์จะเป็นแชมป์ที่ยิ่งใหญ่ก่อนที่มันจะกลายเป็นผู้หญิง ถ้าฉันบันทึกการสนทนาเกี่ยวกับผู้หญิงที่เป็นไปได้ของคาสปารอฟสำหรับฟอรัมใหม่และอีกวันหนึ่งฉันใช้คำพูดของเขาเป็นเพียงการคาดการณ์โดยอาศัยการสังเกตเชิงประจักษ์ของชุมชนหมากรุก การมีส่วนร่วมของผู้หญิงอยู่ในระดับต่ำเสมอและไม่ได้เพิ่มขึ้นอย่างมีนัยสำคัญในขณะที่คอมพิวเตอร์มีประสิทธิภาพอยู่แล้วและมีประสิทธิภาพมากขึ้นอย่างรวดเร็ว เครื่องจักรจะนำเสนอความเท่าเทียมใหม่ – ที่ซึ่งทุกเพศถูกบดขยี้เหมือนมด ทฤษฎีบทของ Zermel บอกเราว่าเกมที่มีข้อมูลครบถ้วน (ผู้เล่นทั้งสองสามารถเห็นชิ้นส่วนทั้งหมดบนกระดานหมากรุก) ซึ่งถือเป็นที่สิ้นสุด (เกมจะจบลงหลังจากการเคลื่อนไหวจำนวนหนึ่ง) มีวิธีแก้ไขและหากทั้งสองฝ่ายเล่น ทางออกที่ดีที่สุดจากนั้นแต่ละเกมจะมีคะแนนเท่ากัน หมากรุกมีความซับซ้อนมากพอที่เราไม่แน่ใจว่าผลลัพธ์จะเป็นอย่างไร แต่เราคิดว่าคนผิวขาวจะชนะทุกครั้งซึ่งในกรณีนี้จะไม่มีการตอบสนองที่เป็นสีดำที่สามารถเปลี่ยนแปลงผลลัพธ์ได้ เกม Connect Four ยังตกอยู่ภายใต้ทฤษฎีบทของ Zermel และการวิเคราะห์พบว่าในเกมนี้น้องสาวที่ร้ายกาจจะชนะเสมอถ้าเธอไปก่อนและเล่นในแง่ดี หากคุณเป็น AP ที่ชอบ QGambit และคุณกำลังหิวโหยสำหรับเนื้อหาเพิ่มเติมในช่วงการระบาดที่ไม่สิ้นสุดนี้ภารกิจต่อไปคือการดู AlphaGo ซึ่งเป็นสารคดีเกี่ยวกับการเพิ่มขึ้นของคอมพิวเตอร์ในเกม Go โบราณซึ่งมีความซับซ้อนมากกว่า หมากรุก. ไม่ล้อเล่นภาพยนตร์เรื่องนี้สร้างความหนักใจให้กับผู้ที่สนใจในสนามและชื่นชมกับดราม่าสะเทือนอารมณ์ที่แข็งแกร่งของลีเซดอลซึ่งเป็นแชมป์ที่ดีที่สุดที่เขาเคยทำมา ภาพยนตร์เรื่องนี้ถ่ายทอดความทุกข์ยากความกล้าหาญความฉลาดและความอ่อนน้อมถ่อมตนของ Sedol ในขณะที่เขาตระหนักดีว่าการแข่งขันกับเครื่องจักรนี้ไม่ใช่แค่เกม แต่เป็นการเกิดขึ้นของระเบียบโลกใหม่ เนื่องจากเขาไม่ได้เป็นโปรแกรมเมอร์เซดอลจึงไม่ได้ชื่นชมสิ่งที่เขาจะต้องเผชิญ แต่ในฐานะผู้เชี่ยวชาญในงานฝีมือของเขาเขารู้สึกได้ถึงน้ำหนักที่ไม่ลดละและทึบแสงของคู่ต่อสู้บนกระดาน เมื่อคุณสนุกกับ AlphaGo ฉันขอแนะนำ (จริงๆแล้ว Google แนะนำ) ให้คุณดูเกมโป๊กเกอร์ระหว่าง Dan Negreanu โรงเรียนเก่ากับโคลนคอมพิวเตอร์ยุคใหม่ Doug Polk ผู้เล่นที่ดีที่สุดในโลกคือเครื่องจักรดังนั้นคนฉลาดอย่าง Polk จึงเลียนแบบกลยุทธ์ของเครื่องจักร ปรับตัวหรือตาย ครั้งหนึ่งฉันเคยแลกเปลี่ยนสั้น ๆ กับ Howard Lederer ฉันถามเขาเกี่ยวกับบอทในเว็บไซต์โป๊กเกอร์ เขาตัดพ้อคำถามด้วยคำว่า “โป๊กเกอร์ไม่เหมือนหมากรุกโป๊กเกอร์เป็นเกมที่มีข้อมูลไม่สมบูรณ์คอมพิวเตอร์ไม่เก่งในเรื่องนี้” ฉันไม่สามารถบอกได้ว่าผู้ดูดเป็นคนโง่หรือเป็นผู้ฉ้อโกงสำหรับ Full Tilt Poker อย่างไรก็ตามเมื่อ 15 ปีก่อนฉันไม่ต้องการสนทนานี้ต่อ แต่ตอนนี้เราอยู่ที่นี่ในปี 2021 และถึงเวลาที่จะสนทนาต่อไปโดยยกเลิกข้อผิดพลาดแรกเกี่ยวกับคอมพิวเตอร์ GTO (ทฤษฎีเกมที่ดีที่สุด) และความเข้าใจผิดอื่น ๆ ที่ทับซ้อนกันทั้งหมดนั่นคือไดโนเสาร์โป๊กเกอร์และนักเล่นโป๊กเกอร์ที่ประกาศตัวเอง การยึดติดอย่างสิ้นหวัง: Fallacy # 1: คอมพิวเตอร์ไม่ถนัดเล่นเกมที่มีข้อมูลไม่ครบถ้วน นี่เป็นเรื่องงมงาย เป็นเรื่องจริงที่ทฤษฎีบทของ Zermel ใช้ไม่ได้กับเกมอย่างโป๊กเกอร์ สำหรับโป๊กเกอร์มีคำพูดอื่น ๆ ที่กล่าวโดยทั่วไปว่ามีวิธีแก้ปัญหาสำหรับเกมและโดยทั่วไปแล้วโซลูชันคอมพิวเตอร์จะเกี่ยวข้องกับ“ กลยุทธ์แบบผสมผสาน” ซึ่งหมายความว่ามีองค์ประกอบแบบสุ่มในกลยุทธ์ (เช่นการเรียกกรรไกรด้วย 1 / 3 ความน่าจะเป็น) คอมพิวเตอร์ค่อนข้างดีและดีกว่ามนุษย์ในการคำนวณความคาดหวังเกี่ยวกับผลลัพธ์ของความน่าจะเป็นโดยเฉพาะอย่างยิ่งถ้าการแจกแจงความน่าจะเป็นเป็นที่รู้จักกันอย่างถูกต้องตามที่อยู่ในแผนภูมิ ตัวอย่างเช่นคอมพิวเตอร์รู้ว่าความน่าจะเป็นของการวาดแบ็คดอร์ฟลัชคืออะไรและโควต้าที่น่าจะเป็นไปได้ที่จะต้องใช้เพื่อพิสูจน์การล่า แม้ว่าโป๊กเกอร์จะมีข้อมูลที่ไม่สมบูรณ์ แต่โป๊กเกอร์แบบไม่มีขีด จำกัด เป็นเกมที่ง่ายกว่าเกม Go แม้ว่า Go จะมีข้อมูลที่ครบถ้วน (ข้อมูลความรู้ทั่วไป) ความผิดพลาด # 2: ความเหนือกว่าของคอมพิวเตอร์เกิดจากความสามารถในการจดจำทุกเกมและปรับให้เข้ากับเกมได้ ในขณะที่ “บอทที่หาประโยชน์” จะวิเคราะห์เกมที่ผ่านมาของคุณและปรับตัวให้เข้ากับจุดอ่อนที่รับรู้ แต่บอท GTO มาตรฐาน (บางครั้งเรียกว่า “บอทแนช”) เป็นโป๊กเกอร์ที่เทียบเท่ากับ BS ในแบล็คแจ็ค กลยุทธ์ GTO ไม่เปลี่ยนแปลงไม่ว่าคุณจะเล่นอย่างไรในอดีต เขาไม่ต้องการข้อมูลนั้นและเขาไม่สนใจ ข้อผิดพลาด # 3: วิธีแก้ปัญหา GTO นั้น “ถูกต้อง” ก็ต่อเมื่อคุณกำลังเล่นกับบ็อต GTO อื่นเนื่องจากสิ่งนี้ถูกสมมติขึ้นเมื่อบอตได้รับการพัฒนาบอท “เรียนรู้” โดยการเล่นกับตัวมันเอง ว่าเป็นสิ่งที่ผิด. “ บอทเล่นกับตัวเองเพื่อเรียนรู้โป๊กเกอร์” เป็นลักษณะที่ไม่ถูกต้องของกระบวนการพัฒนา สื่อชอบโฆษณาเหยื่อคลิกเพื่อรับรู้ผลลัพธ์ใด ๆ ในการประมวลผลว่าเป็นความก้าวหน้าของยุคสมัยโดยอ้างถึง HAL และ Skynet บอท GTO ไม่รู้อะไรเลยเกี่ยวกับโป๊กเกอร์ ที่มาของกลยุทธ์ GTO คือแบบฝึกหัดการคำนวณที่มาจากหน่วยความจำขนาดใหญ่และความเร็วของโปรเซสเซอร์ที่มีอยู่ในคอมพิวเตอร์ในปัจจุบันและการพัฒนาอัลกอริธึมการคำนวณที่มีประสิทธิภาพ (“ การลดความเสียใจให้น้อยที่สุด”) เราไม่เคยอธิบายอัลกอริทึมว่า “แมชชีนเลิร์นนิง” หรือ “ปัญญาประดิษฐ์” – บางครั้งเราเรียกง่ายๆว่า “การปีนเขา” หรือ “การเพิ่มประสิทธิภาพสูงสุด” หรือ “การเพิ่มประสิทธิภาพ” ในทุกขั้นตอนของอัลกอริทึมซ้ำคอมพิวเตอร์กำลังอยู่ในขั้นตอนการพัฒนากลยุทธ์สำหรับแต่ละโต๊ะและกลยุทธ์ปัจจุบันนี้อาจเรียกได้ว่าเป็น “ตัวเอง” เช่นเดียวกับ: “PokerSnowie เล่นกับตัวเอง” แต่มันเป็นเพียงการเล่นซ้ำระหว่างทางขึ้นเขาเพื่อเข้าใกล้จุดสูงสุดซึ่งเป็นกลยุทธ์ที่ดีที่สุดสำหรับโป๊กเกอร์ ค่าที่เหมาะสมนี้ไม่ได้ทำนายคู่ต่อสู้รายใดเป็นพิเศษ มีวิธีอื่น ๆ ที่คุณสามารถคำนวณวิธีแก้ปัญหาได้ (แม้ว่าอาจจะไม่เร็วเท่า) และมันก็ใช้ได้พอ ๆ กัน กลยุทธ์ GTO นี้เป็น “หนังสือ” สำหรับโป๊กเกอร์และจะไม่มีวันเสียเปรียบโดยไม่คำนึงถึงฝ่ายตรงข้าม ไม่มีกลยุทธ์ใดที่จะได้เปรียบ ข้อผิดพลาด # 4: บ็อต GTO สันนิษฐานว่าฉันจะเล่นในลักษณะหนึ่ง แต่ฉันจะเอาชนะสิ่งนี้ด้วยการเล่นที่ไม่ใช่ชุด 72 ของฉันโดยไม่มีตำแหน่ง ไม่ถูกต้อง. บ็อต GTO ไม่ได้ให้ข้อมูลเกี่ยวกับวิธีการเล่นของคุณ ไม่เป็นไร. มันอยู่ยงคงกระพันกับกลยุทธ์ใด ๆ ของฝ่ายตรงข้าม ลองนึกภาพว่าคุณกำลังจะต่อสู้กับ Floyd Mayweather และคุณพูดว่า“ Floyd คาดหวังให้ฉันปรากฏตัวด้วยสมรรถภาพทางกายที่สมบูรณ์แบบ เขาคาดหวังว่าฉันจะฝึกหนักในอีกหกเดือนข้างหน้า ฉันจะนอกใจเขา – ฉันจะดู Netflix และกินโดนัทไปอีกหกเดือน “ฟลอยด์ไม่รู้ว่าคุณจะฝึกหนักแค่ไหนเขารู้ดีว่าถ้าเขาแสดงรูปร่างที่สมบูรณ์แบบก็จะไม่มีคู่ต่อสู้คนใดได้เปรียบเขามันสมเหตุสมผลหรือไม่ที่จะพูดว่า ‘บอทถือว่าฉันจะเล่น ดีฉันจะหลอกบอทด้วยการเล่นโป๊กเกอร์ที่ไม่ดี!” ใช่คุณแสดงให้พวกเขาเห็นแน่นอน! ความผิดพลาด # 5: ฉันพบจุดอ่อน – เมื่อฉันมีสิ่งนี้และสิ่งนั้นจากสิ่งนี้และตำแหน่งนั้นบอทควรทำ X แต่ Y ผิด บอทไม่มีจุดอ่อน คุณกำลังดูการจับมือและผลลัพธ์บางอย่าง แต่ด้วยความน่าจะเป็นที่คุณจะอยู่ในสถานการณ์นี้และมือที่เป็นไปได้ทั้งหมดที่คุณสามารถจับได้จากมุมมองของบอทเกมของเขาถูกต้องและฉันไม่พบ หลุมที่นั่น เป็นเรื่องอันตรายมากที่จะดูเกมด้วยตัวคุณเอง บอททำการเคลื่อนไหวเพื่อปรับสมดุลการเข้าถึงเพื่อที่คุณจะได้ไม่ตัดในสถานการณ์อื่น ๆ หรือหากการ์ดใบอื่นมาถึงแม่น้ำ หากคุณไม่เห็นมันเป็นความผิดพลาดในการคิดเกี่ยวกับโป๊กเกอร์ไม่ใช่ในบอท ความผิดพลาด # 6: ถ้าฉันเล่นไปสักพักฉันจะหาวิธีเล่นและหาจุดอ่อน ไม่ถูกต้อง. ไม่มีความอ่อนแอ. ในความเป็นจริงคุณสามารถโพสต์กลยุทธ์บอทและนั่นจะไม่สร้างความแตกต่าง ถ้าฉันบอกคุณว่าฉันจะเล่น Scissors, Rock and Paper ด้วยความน่าจะเป็น 1/3 ในแต่ละอันการที่คุณรู้ว่ากลยุทธ์ของฉันไม่อนุญาตให้คุณได้เปรียบ ส้นเท้าของ Achilles ไม่ได้ ข้อผิดพลาด # 7: บ็อต Heads-Up Limit ที่นำมาใช้ในคาสิโนประสบความสำเร็จอย่างมากดังนั้นอาจเป็นบ็อต GTO เช่นกัน นี่ไม่ใช่การเปรียบเทียบที่มีความหมาย บอทเกมบางตัวได้รับคำสั่งไม่ให้เล่นเกม A เพราะมันแรงเกินไปสำหรับคนทั่วไป หากคาสิโนตั้งค่าบอทเพื่อเล่นเกม B เพื่อให้บรรลุข้อได้เปรียบมากกว่าผู้เล่นส่วนใหญ่ 5% ผู้ชายที่ดีจริงๆสามารถสร้างรายได้จากบอท GTSO นั้น (บอทที่ต่ำกว่าในทฤษฎีเกม) แต่นั่นเป็นอีกปัญหาหนึ่ง ฉันไม่สนใจว่าคุณเป็นใคร: หากคุณเล่นหัวกับ PokerSnowie คุณจะแพ้ ความผิดพลาด # 8: บอท GTO สามารถเอาชนะผู้เล่นที่อ่อนแอได้ แต่หุ่นยนต์จะมีปัญหากับคู่ต่อสู้ที่เก่งที่สุดเช่น Phil Ivey หรือ Dan Negreanu ไม่ถูกต้อง. สิ่งที่ดีเกี่ยวกับบ็อต GTO คือไม่สำคัญว่าคู่ต่อสู้จะเป็นใคร อย่างดีที่สุดมีคนเล่นกับบอทได้เช่นกัน วงแหวนของบ็อต GTO จะเป็นเหมือนอ่างล้างมือโดยเงินที่ไหลตามเข็มนาฬิกาจะจับปุ่มและเทลงกลางโต๊ะเนื่องจากการคว้า ปัญหาในทางปฏิบัติที่มืออาชีพในโลกแห่งความเป็นจริงต้องเผชิญคือการตัดสินใจว่าทักษะของพวกเขาจะเพียงพอที่จะก้าวไปสู่การเดิมพันที่สูงขึ้นต่อไปซึ่งผู้เล่นมีแนวโน้มที่จะแข็งแกร่งขึ้น อย่างไรก็ตามตอนนี้ผู้เล่นที่เลียนแบบกลยุทธ์ GTO สามารถนั่งลงที่โต๊ะใดก็ได้ในโลกบนเดิมพันใดก็ได้และไม่ต้องกังวลว่าจะเป็นปลา อย่างดีที่สุดเกมจะเป็นแบบแม้ (นอกคราด) แต่ในทางปฏิบัติกลยุทธ์ GTO ให้ประโยชน์อย่างมากกับทุกคนที่คุณพบในธรรมชาติ ความผิดพลาด # 9: Dan Negreanu เป็นมือโปรโป๊กเกอร์ที่มีสร้อยข้อมือ N มานานดังนั้นเขาจะทำลายคอมพิวเตอร์อย่าง Doug Polk ที่ไม่เข้าใจความแตกต่างของโป๊กเกอร์จริง ถ้าผู้ชายอย่าง Polk จำ“ สเกล” ได้และเลียนแบบกลยุทธ์ GTO เขาก็ไม่จำเป็นต้องเข้าใจอะไรเลย เขาไม่จำเป็นต้องรู้ว่าคำว่า “ร่มเงา” หมายถึงอะไร ประสบการณ์การเล่นโป๊กเกอร์ของมืออาชีพอย่าง Negreanu ทำให้พวกเขาได้พบกับการเล่นที่ดีที่สุดในสถานการณ์ที่ซับซ้อน ประสบการณ์นี้ล้าสมัยแล้วเพราะคอมพิวเตอร์เพิ่งคำนวณได้ว่าเกมจริงคืออะไร บางทีในปี 1950 ประสบการณ์ของผู้เล่นทำให้เขาพบว่าประตู 14-in-T นั้นดีกว่าการยืนหยัด เมื่อ Four Riders คำนวณแผนภูมิ BS ประสบการณ์แบล็คแจ็คนี้ไม่เกี่ยวข้อง หนังสือทำให้ประสบการณ์เป็นไปไม่ได้ ตอนนี้ Doug Polk ไม่ใช่ GTO bot เขาเป็นมืออาชีพอันดับต้น ๆ ที่ใช้กลยุทธ์ GTO Negreanu ยิงเพื่อเอาชนะ Polk เท่านั้นก็คือถ้าการจำลอง GTO ของ Polk ไม่แม่นยำและถ้าหลุมนั้นใหญ่พอที่ Negreanu จะค้นหาและใช้ประโยชน์ได้ ฉันสงสัยมัน. การโจมตีที่ยาวนานอีกอย่างหนึ่งก็คือถ้าพวกเขาเล่นสดและถ้า Polk บอกให้เขาให้ข้อมูลเกี่ยวกับหลุมของเขาและถ้า Negreanu สามารถอ่านได้ด้วยวิธีนั้น หรือถ้า Polk มีปัญหาการเอียงและเริ่มถอนตัวจาก GTO หากเขามีไพ่ที่ไม่ดี อาจจะไม่. หรือบางทีเกมอาจจะสั้นพอที่จะทำให้ Negreanu lucky ในรูปแบบเล็ก ๆ หลังจากเล่นกับ AlphaGo แล้ว Lee Sedol ก็หยิบเกมของเขาขึ้นมาและเริ่มบดขยี้ทุกอย่าง (ไม่ใช่ว่าเขายังไม่ได้ทำ) จากนั้นก็ถอนตัวออกจากเกม เขายอมรับว่าเขาพ่ายแพ้แล้ว (ช่างเป็นแนวคิด!) และจะไม่มีใครท้าทายผู้เล่นที่ดีที่สุดในโลก AlphaGo ได้อีก เราจะดูว่า Negreanu มีความศักดิ์สิทธิ์เหมือนกันหรือไม่ ทวีตล่าสุดถามฉันเพราะ Negreanu ดูเหมือนจะมีข้อสงสัยเกี่ยวกับเกมบอทและแนะนำว่ามีเส้นบาง ๆ ระหว่างอัจฉริยะกับลา ฉันคิดว่าเขายังคงหวังว่าจะมีข้อบกพร่องในกลยุทธ์ GTO มันไม่ใช่. ล่าสุดฉันได้ยินมาว่า Negreanu กำลังติดตามการแข่งขันและมีบางอย่างบ่งชี้ว่าสาเหตุหนึ่งคือ Negreanu กำลังฝึกกับ PokerSnowie และปรับตัวได้ขอบคุณเขา! หาก Negreanu สามารถเรียนรู้กลยุทธ์ GTO ได้อย่างรวดเร็วเขาก็สามารถยกระดับสนามแข่งขันได้ซึ่งจะเป็นความสำเร็จที่น่าทึ่ง ไดโนเสาร์สามารถอยู่รอดได้โดยการวิวัฒนาการเท่านั้น เราจะได้เห็นในปี 2021

[Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]


คาสิโน 168
คาสิโน168
คาสิโน ออนไลน์ 888
คาสิโน ออนไลน์888
ทางเข้า คาสิโน

Leave a Reply

Your email address will not be published. Required fields are marked *