สมดุลของแนช. ทฤษฎีเกมสำหรับนักเศรษฐศาสตร์ (John Nash)

สารบัญ:

สมดุลของแนช. ทฤษฎีเกมสำหรับนักเศรษฐศาสตร์ (John Nash)
สมดุลของแนช. ทฤษฎีเกมสำหรับนักเศรษฐศาสตร์ (John Nash)

วีดีโอ: สมดุลของแนช. ทฤษฎีเกมสำหรับนักเศรษฐศาสตร์ (John Nash)

วีดีโอ: สมดุลของแนช. ทฤษฎีเกมสำหรับนักเศรษฐศาสตร์ (John Nash)
วีดีโอ: นักคณิตในตำนาน ตอน ดุลยภาพแนช (Nash Equilibrium) 2024, พฤศจิกายน
Anonim

ในช่วงทศวรรษที่ 1930 จอห์น ฟอน นอยมันน์ และออสการ์ มอร์เกนสเติร์น กลายเป็นผู้ก่อตั้งสาขาคณิตศาสตร์ใหม่และน่าสนใจที่เรียกว่า "ทฤษฎีเกม" ในปี 1950 นักคณิตศาสตร์หนุ่ม John Nash เริ่มให้ความสนใจในทิศทางนี้ ทฤษฎีความสมดุลกลายเป็นหัวข้อของวิทยานิพนธ์ซึ่งเขาเขียนเมื่ออายุ 21 ปี จึงถือกำเนิดเป็นกลยุทธ์เกมใหม่ที่เรียกว่า "Nash Equilibrium" ซึ่งได้รับรางวัลโนเบลหลายปีต่อมา - ในปี 1994

สมดุลของแนช
สมดุลของแนช

ช่องว่างยาวระหว่างการเขียนวิทยานิพนธ์กับการยอมรับทั่วไปได้กลายเป็นบททดสอบสำหรับนักคณิตศาสตร์แล้ว อัจฉริยะที่ไม่ได้รับการจดจำส่งผลให้เกิดความผิดปกติทางจิตอย่างร้ายแรง แต่ John Nash สามารถแก้ปัญหานี้ได้ด้วยความคิดเชิงตรรกะที่ยอดเยี่ยมของเขา ทฤษฎีสมดุลแนชของเขาได้รับรางวัลโนเบลและชีวิตของเขาถูกถ่ายทำในจิตใจที่สวยงาม

สั้น ๆ เกี่ยวกับทฤษฎีเกม

เนื่องจากทฤษฎีสมดุลของแนชอธิบายพฤติกรรมของผู้คนในเงื่อนไขของการมีปฏิสัมพันธ์ จึงควรพิจารณาแนวคิดพื้นฐานของทฤษฎีเกม

ทฤษฎีเกมศึกษาพฤติกรรมของผู้เข้าร่วม (ตัวแทน) ในแง่ของการมีปฏิสัมพันธ์ระหว่างกันเหมือนเกม เมื่อผลลัพธ์ขึ้นอยู่กับการตัดสินใจและพฤติกรรมของคนหลายๆ คนผู้เข้าร่วมทำการตัดสินใจตามการคาดการณ์ของเขาเกี่ยวกับพฤติกรรมของผู้อื่น ซึ่งเรียกว่ากลยุทธ์ของเกม

นอกจากนี้ยังมีกลยุทธ์ที่โดดเด่นซึ่งผู้เข้าร่วมจะได้รับผลลัพธ์ที่ดีที่สุดสำหรับพฤติกรรมของผู้เข้าร่วมคนอื่นๆ นี่คือกลยุทธ์ win-win ที่ดีที่สุดของผู้เล่น

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษและความก้าวหน้าทางวิทยาศาสตร์

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษคือกรณีของเกมที่ผู้เข้าร่วมถูกบังคับให้ตัดสินใจอย่างมีเหตุผล บรรลุเป้าหมายร่วมกันเมื่อเผชิญกับความขัดแย้งของทางเลือก คำถามคือเขาจะเลือกทางเลือกใด โดยคำนึงถึงความสนใจส่วนตัวและประโยชน์ส่วนรวม ตลอดจนความเป็นไปไม่ได้ที่จะได้ทั้งสองอย่าง ผู้เล่นดูเหมือนถูกคุมขังในสภาพแวดล้อมเกมที่ยากลำบาก ซึ่งบางครั้งทำให้พวกเขาคิดอย่างมีประสิทธิผลมาก

ตัวอย่างสมดุลของแนช
ตัวอย่างสมดุลของแนช

ภาวะที่กลืนไม่เข้าคายไม่ออกนี้ถูกสำรวจโดยนักคณิตศาสตร์ชาวอเมริกัน จอห์น แนช ความสมดุลที่เขาทำขึ้นนั้นเป็นการปฏิวัติในแบบของมันเอง โดยเฉพาะอย่างยิ่ง ความคิดใหม่นี้มีอิทธิพลต่อความคิดเห็นของนักเศรษฐศาสตร์เกี่ยวกับวิธีที่ผู้เล่นในตลาดตัดสินใจ โดยคำนึงถึงผลประโยชน์ของผู้อื่น โดยมีปฏิสัมพันธ์อย่างใกล้ชิดและจุดตัดของผลประโยชน์

ควรศึกษาทฤษฎีเกมผ่านตัวอย่างที่เป็นรูปธรรม เนื่องจากวินัยทางคณิตศาสตร์นี้เองไม่ใช่ทฤษฎีที่งมงาย

ตัวอย่างภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

ตัวอย่าง คนสองคนก่อเหตุปล้นชิงทรัพย์ ตกไปอยู่ในมือของตำรวจ และถูกสอบปากคำในห้องขังแยกกัน ในเวลาเดียวกัน เจ้าหน้าที่ตำรวจเสนอเงื่อนไขที่เอื้ออำนวยแก่ผู้เข้าร่วมแต่ละคน ซึ่งเขาจะได้รับการปล่อยตัวหากเขาให้การเป็นพยานกับคู่ของตน แต่ละอาชญากรมีชุดกลยุทธ์ต่อไปนี้ที่เขาจะพิจารณา:

  1. ให้การเป็นพยานพร้อมกันและรับโทษจำคุก 2.5 ปี
  2. ทั้งคู่เงียบพร้อมกันและรับคนละ 1 ปี เพราะในกรณีนี้ ฐานหลักฐานความผิดของพวกเขาจะมีน้อย
  3. คนหนึ่งให้การเป็นพยานและได้รับการปล่อยตัว อีกคนเงียบและถูกจำคุก 5 ปี

เห็นได้ชัดว่าผลของคดีขึ้นอยู่กับการตัดสินใจของผู้เข้าร่วมทั้งคู่ แต่พวกเขาไม่สามารถตกลงกันได้ เพราะพวกเขานั่งอยู่คนละห้องกัน ความขัดแย้งทางผลประโยชน์ส่วนตัวในการต่อสู้เพื่อผลประโยชน์ร่วมกันก็มองเห็นได้ชัดเจนเช่นกัน ผู้ต้องขังแต่ละคนมีตัวเลือกในการดำเนินการ 2 แบบและ 4 ตัวเลือกสำหรับผลลัพธ์

ห่วงโซ่ของการอนุมานเชิงตรรกะ

ดังนั้น ผู้กระทำผิด A กำลังพิจารณาตัวเลือกต่อไปนี้:

  1. ฉันเงียบและคู่ของฉันเงียบ - เราทั้งคู่จะถูกจำคุก 1 ปี
  2. ฉันหันไปหาคู่ของฉันและเขาก็ส่งฉันเข้า - เราทั้งคู่ถูกจำคุก 2.5 ปี
  3. ฉันเงียบและคู่ของฉันทรยศ - ฉันจะถูกจำคุก 5 ปีและเขาจะเป็นอิสระ
  4. ฉันมอบคู่ครองของฉัน แต่เขาเงียบ - ฉันได้รับอิสระและเขาถูกจำคุก 5 ปี

ให้เมทริกซ์ของวิธีแก้ปัญหาที่เป็นไปได้และผลลัพธ์เพื่อความชัดเจน

ตารางผลลัพธ์ที่เป็นไปได้ของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

ทฤษฎีสมดุลของแนช
ทฤษฎีสมดุลของแนช

คำถามคือ ผู้เข้าแข่งขันแต่ละคนจะเลือกอะไร

"เงียบ พูดไม่ได้" หรือ "เงียบไม่ได้ พูดไม่ได้"

เพื่อให้เข้าใจถึงทางเลือกของผู้เข้าร่วม คุณต้องเข้าใจห่วงโซ่ความคิดของเขา ตามเหตุผลของความผิดทางอาญา ก: ถ้าฉันเงียบและคู่ของฉันยังคงเงียบ เราจะได้รับระยะเวลาขั้นต่ำ (1 ปี) แต่ฉันฉันไม่รู้ว่าเขาจะประพฤติตัวอย่างไร ถ้าเขาให้การเป็นพยานปรักปรำฉัน ฉันก็ให้การเป็นพยานดีกว่า ไม่อย่างนั้นฉันนั่งลงได้ 5 ปี ฉันค่อนข้างจะนั่งลง 2.5 ปีมากกว่า 5 ปี ถ้าเขานิ่งเงียบ ยิ่งฉันต้องให้การเป็นพยาน เพราะด้วยวิธีนี้ ฉันจะได้รับอิสรภาพ ผู้เข้าร่วม B.

จอห์น แนช บาลานซ์
จอห์น แนช บาลานซ์

ไม่ยากที่จะเห็นว่ากลยุทธ์ที่โดดเด่นสำหรับผู้กระทำความผิดแต่ละคนคือการให้การเป็นพยาน จุดที่ดีที่สุดของเกมนี้เกิดขึ้นเมื่ออาชญากรทั้งคู่ให้การเป็นพยานและรับ "รางวัล" - 2.5 ปีในคุก ทฤษฎีเกมแนชเรียกสมดุลนี้

โซลูชันแนชที่ไม่เหมาะสมที่สุด

ลักษณะการปฏิวัติของมุมมองของนาเชียนคือความสมดุลดังกล่าวไม่เหมาะสมเมื่อพิจารณาผู้เข้าร่วมแต่ละคนและผลประโยชน์ส่วนตัวของเขา ท้ายที่สุด ทางที่ดีที่สุดคืออยู่เงียบๆ และเป็นอิสระ

สมดุลของแนชเป็นจุดบรรจบของความสนใจ โดยที่ผู้เข้าร่วมแต่ละคนเลือกตัวเลือกที่เหมาะสมที่สุดสำหรับเขา เฉพาะเมื่อผู้เข้าร่วมคนอื่นเลือกกลยุทธ์บางอย่าง

เมื่อพิจารณาจากตัวเลือกเมื่ออาชญากรทั้งคู่ถูกปิดปากและรับเพียง 1 ปี เราเรียกมันว่าตัวเลือก Pareto-optimal อย่างไรก็ตาม เป็นไปได้ก็ต่อเมื่ออาชญากรสามารถตกลงล่วงหน้าได้ แต่ถึงแม้สิ่งนี้จะไม่รับประกันผลลัพธ์นี้ เนื่องจากความอยากที่จะถอยห่างจากข้อตกลงและหลีกเลี่ยงการลงโทษนั้นยิ่งใหญ่ ขาดความไว้วางใจซึ่งกันและกันอย่างสมบูรณ์และอันตรายจากการได้รับ 5 ปีบังคับให้เลือกตัวเลือกด้วยการยอมรับ ไตร่ตรองถึงสิ่งที่ผู้เข้าร่วมจะยึดมั่นตัวเลือกที่มีความเงียบการแสดงคอนเสิร์ตนั้นไม่มีเหตุผล เราสามารถสรุปข้อสรุปดังกล่าวได้หากเราศึกษาสมดุลของแนช ตัวอย่างพิสูจน์ว่าคุณถูกเท่านั้น

เห็นแก่ตัวหรือมีเหตุผล

ทฤษฎีสมดุลของแนชได้ข้อสรุปที่น่าตกใจซึ่งหักล้างหลักการที่เคยมีมาก่อน ตัวอย่างเช่น อดัม สมิธถือว่าพฤติกรรมของผู้เข้าร่วมแต่ละคนมีความเห็นแก่ตัวโดยสิ้นเชิง ซึ่งทำให้ระบบมีความสมดุล ทฤษฎีนี้เรียกว่า “มือที่มองไม่เห็นของตลาด”

ทฤษฎีสมดุลของจอห์น แนช
ทฤษฎีสมดุลของจอห์น แนช

John Nash เห็นว่าหากผู้เข้าร่วมทุกคนทำเพื่อตนเอง สิ่งนี้จะไม่มีวันนำไปสู่ผลลัพธ์ของกลุ่มที่ดีที่สุด เนื่องจากผู้เข้าร่วมแต่ละคนมีการคิดอย่างมีเหตุผล ทางเลือกที่เสนอโดยกลยุทธ์สมดุลของแนชจึงมีโอกาสมากกว่า

การทดลองของผู้ชายล้วนๆ

ตัวอย่างที่สำคัญคือเกมสีบลอนด์ Paradox ซึ่งถึงแม้จะดูไม่เข้าท่า แต่ก็แสดงให้เห็นชัดเจนว่าทฤษฎีเกมของ Nash ทำงานอย่างไร

ในเกมนี้ คุณต้องจินตนาการว่ามีกลุ่มคนอิสระมาที่บาร์ ใกล้ๆ กันนั้นเป็นกลุ่มสาวผมบลอนด์ ผู้ชายแสดงยังไงให้ได้แฟนที่ดีที่สุดสำหรับตัวเอง

สถานการณ์สมดุล
สถานการณ์สมดุล

ดังนั้น เหตุผลของหนุ่มๆ: ถ้าทุกคนเริ่มคุ้นเคยกับสาวผมบลอนด์ เป็นไปได้มากว่าไม่มีใครเข้าใจ เพื่อนของเธอก็ไม่อยากรู้จัก ไม่มีใครอยากเป็นทางเลือกที่สอง แต่ถ้าหนุ่มๆเลือกเลี่ยงผมบลอนด์แล้ว โอกาสที่ผู้ชายแต่ละคนจะหาแฟนที่ดีในหมู่สาวๆ ก็มีสูง

สถานการณ์สมดุลของแนชไม่เหมาะกับผู้ชาย เพราะการไล่ตามแต่ผลประโยชน์ส่วนตนเท่านั้น ทุกคนจะเลือกสาวผมบลอนด์ จะเห็นได้ว่าการแสวงหาผลประโยชน์ที่เห็นแก่ตัวเพียงอย่างเดียวจะเท่ากับการล่มสลายของผลประโยชน์กลุ่ม สมดุลของแนชจะหมายความว่าผู้ชายแต่ละคนทำเพื่อผลประโยชน์ของตัวเองซึ่งเกี่ยวข้องกับผลประโยชน์ของทั้งกลุ่ม นี่ไม่ใช่ตัวเลือกที่ดีที่สุดสำหรับทุกคนโดยส่วนตัว แต่ดีที่สุดสำหรับทุกคน โดยอิงตามกลยุทธ์โดยรวมเพื่อความสำเร็จ

ทั้งชีวิตของเราคือเกม

การตัดสินใจในโลกแห่งความเป็นจริงนั้นเหมือนกับเกมที่คุณคาดหวังพฤติกรรมที่มีเหตุผลบางอย่างจากผู้เข้าร่วมคนอื่นๆ เช่นกัน ในธุรกิจ ที่ทำงาน ในทีม ในบริษัท และแม้แต่ในความสัมพันธ์กับเพศตรงข้าม ตั้งแต่เรื่องใหญ่ไปจนถึงสถานการณ์ชีวิตปกติ ทุกอย่างเป็นไปตามกฎหมายอย่างใดอย่างหนึ่ง

ทฤษฎีเกมแนช
ทฤษฎีเกมแนช

แน่นอนว่าสถานการณ์ในเกมด้านบนที่มีอาชญากรและแถบนั้นเป็นเพียงภาพประกอบที่ยอดเยี่ยมที่แสดงให้เห็นถึงความสมดุลของแนช ตัวอย่างของภาวะที่กลืนไม่เข้าคายไม่ออกดังกล่าวมักเกิดขึ้นในตลาดจริง และวิธีนี้ได้ผลโดยเฉพาะอย่างยิ่งในกรณีที่ผู้ผูกขาดสองคนควบคุมตลาด

กลยุทธ์ผสม

บ่อยครั้งที่เรามีส่วนร่วมในเกมหลายเกมพร้อมกัน การเลือกตัวเลือกใดตัวเลือกหนึ่งในเกมหนึ่ง โดยใช้กลยุทธ์ที่มีเหตุผล แต่คุณจะจบลงในอีกเกมหนึ่ง หลังจากตัดสินใจด้วยเหตุผลบางอย่าง คุณอาจพบว่าผลลัพธ์ของคุณไม่เป็นที่ชื่นชอบ อะไรเอาไหม

ลองพิจารณากลยุทธ์สองประเภท:

  • กลยุทธ์บริสุทธิ์คือพฤติกรรมของผู้เข้าร่วม ซึ่งมาจากการคิดถึงพฤติกรรมที่เป็นไปได้ของผู้เข้าร่วมคนอื่นๆ
  • กลยุทธ์ผสมหรือกลยุทธ์สุ่มคือการสลับกลยุทธ์ล้วนๆ โดยการสุ่มหรือการเลือกกลยุทธ์ล้วนๆ ที่มีความน่าจะเป็นที่แน่นอน กลยุทธ์นี้เรียกอีกอย่างว่าการสุ่ม
สมดุลของแนชในกลยุทธ์แบบผสม
สมดุลของแนชในกลยุทธ์แบบผสม

เมื่อพิจารณาถึงพฤติกรรมนี้ เราได้รูปลักษณ์ใหม่ที่สมดุลของแนช หากก่อนหน้านี้มีการกล่าวว่าผู้เล่นเลือกกลยุทธ์เพียงครั้งเดียวก็สามารถจินตนาการถึงพฤติกรรมอื่นได้ สามารถสันนิษฐานได้ว่าผู้เล่นเลือกกลยุทธ์แบบสุ่มด้วยความน่าจะเป็นที่แน่นอน เกมที่ไม่สามารถหาสมดุลของแนชในกลยุทธ์ที่บริสุทธิ์มักจะมีกลยุทธ์แบบผสม

สมดุลของแนชในกลยุทธ์แบบผสมเรียกว่าสมดุลแบบผสม นี่คือสมดุลที่ผู้เข้าร่วมแต่ละคนเลือกความถี่ที่เหมาะสมที่สุดในการเลือกกลยุทธ์ของตน โดยที่ผู้เข้าร่วมคนอื่นๆ จะเลือกกลยุทธ์ของตนด้วยความถี่ที่กำหนด

บทลงโทษและกลยุทธ์ผสม

ตัวอย่างกลยุทธ์แบบผสมสามารถพบได้ในเกมฟุตบอล ภาพประกอบที่ดีที่สุดของกลยุทธ์แบบผสมอาจเป็นการยิงลูกโทษ ดังนั้น เรามีผู้รักษาประตูที่สามารถกระโดดเข้ามุมได้เพียงมุมเดียว และผู้เล่นที่จะได้จุดโทษ

ดังนั้น ถ้าครั้งแรกที่ผู้เล่นเลือกกลวิธียิงมุมซ้าย แล้วผู้รักษาประตูก็ตกมุมนี้และจับบอลด้วย อะไรจะเกิดขึ้นในครั้งที่สอง? หากผู้เล่นจะตีในมุมตรงข้าม ซึ่งน่าจะชัดเกินไป แต่การตีในมุมเดียวกันนั้นไม่ชัดเจน ดังนั้นทั้งผู้รักษาประตูและนักเตะจึงไม่มีทางเลือกอื่นนอกจากต้องอาศัยการสุ่มเลือก

ดังนั้น โดยการสลับการเลือกแบบสุ่มด้วยกลยุทธ์ที่บริสุทธิ์ ผู้เล่นและผู้รักษาประตูพยายามให้ได้ผลลัพธ์สูงสุด

แนะนำ: