ถึงเวลาจ่าย'โบนัส' ปวดสมอง ใช้เกณฑ์แบบไหนดี

ถึงเวลาจ่าย'โบนัส' ปวดสมอง ใช้เกณฑ์แบบไหนดี
13 ธันวาคม 2563 | โดย นำชัย ชีววิวรรธน์ [email protected]
979

การพิจารณา"โบนัส" ส่วนใหญ่ดูจากผลงานรายบุคคล น้อยมากที่จะคำนึงถึงผลงานกลุ่มที่มีการร่วมไม้ร่วมมือกัน เพื่อทำให้งานลุล่วงไปด้วยดี แล้วการช่วยเหลือทำงานเป็นกลุ่มสำคัญอย่างไร

ทีมนักวิจัยชาวออสเตรเลีย (จากมหาวิทยาลัยซิดนีย์และมหาวิทยาลัยเวสต์เทิร์นซิดนีย์) และชาวอังกฤษ (จากมหาวิทยาลัยไลเชสเตอร์) มองว่า วิธีการที่ทำกับแม่ไก่เหล่านี้เป็นกระบวนการกลุ่ม คล้ายกับกรณีตัวอย่างที่โด่งดังรู้จักกันทางจิตวิทยา คือ ทวิบถนักโทษแบบซ้ำ (iterated prisoner's dilemma, IPD) คำว่าทวิบถ (dilemma) ก็คือ ภาวะแบบกลืนไม่เข้าคายไม่ออกหรือภาวะที่ชวนให้ยุ่งยากใจ

สถานการณ์แบบ IPD ก็คือ หากต้องสอบสวนนักโทษสองคน ทางเลือกของนักโทษทั้งคู่คือ หากทั้งคู่ร่วมมือกัน ไม่มีการหักหลังกัน ผลคือทั้งคู่จะมีโอกาสได้รับโทษเท่าๆ กัน

ขณะที่หากมีคนใดคนหนึ่งหักหลัง คนที่หักหลังนั้นจะได้รับโทษน้อยกว่าอีกคนที่โดนหักหลัง แต่หากทั้งคู่หักหลังเหมือนๆ กัน ผลลัพธ์แม้จะไม่ดีเท่าที่ตนเป็นคนหักหลังคนเดียว แต่ก็ยังดีกว่าที่ตัวเองจะเป็นคนโดนหักหลัง แม้ว่าจะไม่ดีเท่ากับที่หุบปากไว้ทั้งคู่ก็ตาม

หากสถานการณ์แบบนี้ มีโอกาสต้องเล่นเพียงหนเดียว ทางเลือกที่ดีที่สุดก็คือ การเลือกหักหลังไว้ก่อน เพื่อไม่ให้เกิดกรณีที่ตัวเองโดนหักหลังฝ่ายเดียว ซึ่งจะเป็นกรณีที่แย่ที่สุดที่จะเกิดขึ้นได้กับใครคนใดคนหนึ่งในเกม มีชื่อเรียกสภาวะแบบจำเพาะนี้ว่าเป็น สมดุลของแนช (Nash equilibrium)

แต่สถานการณ์แบบนี้จะเปลี่ยนไปทันที หากต้องเล่นบทบาทนี้ซ้ำๆ ตัวเลือกที่ดีที่สุดในกรณีนี้จะไม่ง่ายดายอีกต่อไป รอเบิร์ต แอกเซลรอด (Robert Axelrod) เคยพิสูจน์ไว้แล้วว่า กรณีที่ต้องผ่าน IPD ซ้ำๆ นั้น วิธีการที่ดีที่สุดได้แก่การร่วมมือกันในตอนแรกสุด

จากนั้นครั้งต่อๆ ไปก็ทำแบบที่อีกคนทำในคราวที่แล้ว เช่น ร่วมมือหรือหักหลังกลับ โดยเมื่อทำแบบนี้จะนำไปสู่ความร่วมมือ ซึ่งทำให้ได้ประโยชน์สูงสุดสำหรับทั้งสองคน โดยที่ไม่ต้องมีใครเป็นแพะรับบาปฝ่ายเดียวไปตลอด

กลับมาที่เรื่องโบนัสอีกที ทีมนักวิจัยกลุ่มนี้ประยุกต์ใช้วิธีการของแอกเซลรอดในการทดสอบผลกระทบของการให้รางวัลแบบรายคนกับแบบรายกลุ่ม โดยใช้เกมต่างๆ มากมายกว่า 14,000 เกม (รวมทั้งเกมนักโทษข้างต้นด้วย) เมื่อทดสอบซ้ำๆ ไปหลายรอบก็จะได้ผลว่า ใครหรือกลุ่มใดเล่นเกมแบบนี้ได้ที่สุด

จากนั้น ก็นำรูปแบบที่ประสบความสำเร็จดีที่สุดหากให้รางวัลเป็นรายคน หรือแบบที่ประสบความสำเร็จแบบเป็นกลุ่มที่ทำงานด้วยกันดีที่สุด (คล้ายๆ กับกรณีของกลุ่มแม่ไก่ที่กล่าวไว้ตอนต้น) มาผ่านเทคนิคทางคณิตศาสตร์ที่ใช้จัดการกับข้อมูลทางพันธุกรรมที่เรียกว่า เจเนติกอัลกอริทึม (genetic algorithm) เพื่อสร้าง “ลูกผสม” ที่มีรูปแบบการเล่นคาบเกี่ยวระหว่างคนที่เล่นเก่งสุดรายคน หรือเป็นแบบกลุ่ม แล้วก็ทำซ้ำๆ ไปเรื่อยๆ เสมือนปล่อยให้เกิดวิวัฒนาการตามธรรมชาติ

ผลลัพธ์สุดท้ายน่าทึ่งมากครับ กล่าวคือ สำหรับเกมส่วนใหญ่แล้ว รางวัลแบบกลุ่มให้ผลลัพธ์ดีที่สุด เพราะไปกระตุ้นให้เกิดความร่วมมือ แม้ว่าในบางสถานการณ์การให้รางวัลแบบรายคนจะได้ผลดีมากก็ตาม

เรื่องที่น่าสังเกตก็คือ กลุ่มที่ทำผลงานได้ดีจนได้รางวัลนั้น คนที่ทำได้ดีอาศัยความช่วยเหลือของคนที่ทำไม่ดีเท่าในกลุ่มด้วย กลยุทธ์แบบผสมผสานสนับสนุนและทำให้เกิดผลดีในระยะยาว

ในขณะที่การให้รางวัลแบบรายคนนั้น ไม่ก่อให้เกิดความร่วมมือ และมีแนวโน้มจะทำให้เกิดการหลอกใช้หรือเอาเปรียบกันมากขึ้น อีกเรืองหนึ่งที่น่าสนใจก็คือ การจะได้ผลลัพธ์แบบยอดเยี่ยมเป็นกลุ่มนี้ ต้องอาศัยกลยุทธ์แบบผสมผสานหลายๆ แบบ

แต่เรื่องที่น่าสนใจที่สุดที่การทดลองนี้สรุปได้ก็คือ ในกลุ่มที่ได้ผลลัพธ์ดีที่สุดจากการให้รางวัลแบบกลุ่มนั้น จะมีคนที่ทำผลงานได้แย่ที่สุดในกลุ่ม คนพวกนี้มักไม่ใช่พวกอู้หรือเอาเปรียบ แต่เป็นคนที่มีบทบาทสำคัญแบบที่กลุ่มจะขาดไม่ได้ หากเทียบเป็นคนในสำนักงานก็จะเป็นพวกที่คอยช่วยเหลือคนอื่นๆ ในกลุ่มทำโน่นนี่นั่นอยู่ตลอด ไม่ค่อยจะยอมปฏิเสธใคร แม้ว่าบางครั้งจะช่วย จนกระทบกระเทือนงานตัวเองก็ตาม

พวกเขาเรียกคนพวกนี้ว่าเป็นพวกยอมสละตน (self-sacrificer)

เห็นได้ชัดนะครับ ความเสียสละเป็นหัวใจของผลลัพธ์แบบกลุ่มที่ดี (และไม่ใช่ทุกคนชอบที่จะเสียสละ) นี่เองจึงเป็นคำตอบว่าเหตุใดหากพิจารณาในระยะยาว การให้โบนัสแบบคำนึงถึงผลงานกลุ่มย่อมดีกว่าการให้โบนัสที่เน้นผลงานรายคน !

 

 

 

 

แชร์ข่าว :
เพิ่มเพื่อน
Tags:

ข่าวที่เกี่ยวข้อง