หากถามเอไอของ กูเกิล (Google) ว่า ในคำว่า Google มีตัวอักษร P กี่ตัว คำตอบที่คนส่วนใหญ่น่าจะตอบได้ทันทีคือ “ไม่มีเลย” แต่คำตอบจากระบบ AI Overview ของกูเกิลกลับตอบว่า “มี 2 ตัว”
กรณีนี้กลายเป็นตัวอย่างที่ถูกแชร์ต่อกันบนโลกออนไลน์ หลังผู้ใช้งานจำนวนมากเริ่มทดลองค้นหาคำง่ายๆ ผ่านระบบค้นหาแบบใหม่ของกูเกิลที่ใช้ปัญญาประดิษฐ์สร้างคำตอบสรุปอัตโนมัติด้านบนผลการค้นหา หรือที่เรียกว่า AI Overview
นอกจากคำว่า Google แล้ว ระบบยังตอบผิดในคำอื่นๆ ด้วย เช่น หากถามคำว่า “poop” มีตัวอักษร r หนึ่งตัว ทั้งที่ไม่มีเลย หรือบอกว่าคำว่า journalism มีตัว d สองตัว แต่เมื่อสะกดคำออกมากลับเขียนเป็น “j-o-u-r-n-a-d-i-s-m” ซึ่งสะกดผิดไปจากเดิม
อีกตัวอย่างหนึ่ง ระบบสามารถตอบได้ว่าชื่อสกุลของประธานาธิบดีสหรัฐมีตัว P หนึ่งตัว แต่กลับสะกดคำว่า Trump ออกมาเป็น “t-r-p-u-m” ปัญหาเหล่านี้กลายเป็นที่วิพากษ์วิจารณ์ เพราะเป็นความผิดพลาดระดับพื้นฐาน ทั้งที่ระบบเอไอของกูเกิลถูกนำเสนอว่าเป็นก้าวสำคัญของอนาคตการค้นหาบนอินเทอร์เน็ต
ปัญหาที่ไม่ใช่เรื่องใหม่ของ Google Search
ก่อนหน้านี้ กูเกิลเคยเผชิญเสียงวิจารณ์มาแล้วเมื่อเปิดตัว AI Overview ครั้งแรก ระบบเคยดึงข้อมูลจากโพสต์ล้อเลียนของเว็บไซต์ข่าวเสียดสีอย่าง The Onion และกระทู้บน Reddit มาใช้เป็นคำตอบจริง รวมถึงเคยแนะนำให้ผู้ใช้งาน “กินหิน” หรือ “ใส่กาวลงบนพิซซ่า” เพื่อช่วยให้ชีสติดแน่นขึ้น
แม้กูเกิลจะปรับปรุงระบบหลายรอบ แต่ปัญหาความผิดพลาดของเอไอก็ยังเกิดขึ้นต่อเนื่อง โดยเฉพาะเมื่อบริษัทเดินหน้าผลักดันให้ Generative AI หรือเอไอที่สร้างข้อความได้เอง กลายเป็นหัวใจหลักของระบบค้นหาที่บริษัทพัฒนามานานเกือบ 30 ปี
กูเกิลให้สัมภาษณ์กับสำนักข่าว TechCrunch ผ่านอีเมลว่า “การนับตัวอักษรในคำเป็นปัญหาที่โมเดลภาษาขนาดใหญ่ (LLM) เผชิญกันมานาน และเรากำลังพยายามแก้ไขปัญหานี้อยู่”
ทำไมเอไอที่แก้โจทย์คณิตศาสตร์ได้ถึงนับตัวอักษรไม่ได้?
แม้เอไอรุ่นใหม่จะสามารถเขียนโปรแกรม สรุปบทความ หรือแก้โจทย์คณิตศาสตร์ที่ซับซ้อนได้ แต่เรื่องพื้นฐานอย่างการนับตัวอักษรกลับยังเป็นจุดอ่อนสำคัญ
วงการเอไอมีมุกที่ถูกพูดถึงมาหลายปีว่า เวลาบริษัทเปิดตัวโมเดลเอไอใหม่ วิธีทดสอบง่ายๆ คือถามว่า “คำว่า strawberry มีตัว r กี่ตัว” เพราะโมเดลจำนวนมากตอบผิด สาเหตุสำคัญมาจากวิธีการทำงานของโมเดลภาษา ซึ่งต่างจากวิธีที่มนุษย์อ่านภาษา
มนุษย์มองคำว่า Google เป็นชุดของตัวอักษร G-o-o-g-l-e และสามารถแยกนับตัวอักษรทีละตัวได้ แต่เอไอไม่ได้มองภาษาแบบนั้น
เอไอส่วนใหญ่ในปัจจุบันถูกสร้างบนสถาปัตยกรรมที่เรียกว่า Transformer โดยระบบจะไม่ได้อ่าน “ตัวอักษร” หรือ “คำ” แบบตรงไปตรงมา แต่จะเปลี่ยนข้อความทั้งหมดให้กลายเป็นหน่วยข้อมูลที่เรียกว่า โทเคน (token) ก่อน
โทเคนอาจเป็นทั้งคำเต็ม พยางค์ หรือบางครั้งอาจเป็นเพียงบางส่วนของคำ ขึ้นอยู่กับวิธีออกแบบโมเดล เมื่อผู้ใช้พิมพ์คำถามเข้าไป เอไอจะไม่เห็นตัวอักษรทีละตัวเหมือนมนุษย์ แต่จะเห็นเป็นชุดข้อมูลตัวเลขที่แทนความหมายของภาษา จากนั้นจึงคาดเดาคำตอบที่มีความเป็นไปได้สูงที่สุดตามรูปแบบข้อมูลที่เคยเรียนรู้มา
แมทธิว กัซเดียล (Matthew Guzdial) นักวิจัยด้านเอไอและผู้ช่วยศาสตราจารย์จากมหาวิทยาลัยอัลเบอร์ตา อธิบายกับ TechCrunch ว่า โมเดลภาษาไม่ได้อ่านข้อความจริงๆ
เขาระบุว่า เมื่อเอไอเห็นคำว่า “the” ระบบจะเข้าใจความหมายของคำทั้งคำ แต่ไม่ได้เข้าใจว่าในคำนั้นประกอบด้วยตัวอักษร T, H และ E กล่าวอีกแบบคือ เอไอเข้าใจความหมายรวมของภาษาได้ดีมาก แต่ไม่ได้เข้าใจโครงสร้างย่อยของคำในแบบเดียวกับมนุษย์
ข้อจำกัดที่อาจแก้ได้ยาก
นักวิจัยจำนวนหนึ่งมองว่าปัญหานี้อาจไม่ได้เป็นเพียงบั๊กเล็กๆ แต่เป็นข้อจำกัดที่ฝังอยู่ในโครงสร้างพื้นฐานของโมเดลภาษา
เชอริแดน ฟอยชต์ (Sheridan Feucht) นักศึกษาปริญญาเอกจากมหาวิทยาลัยนอร์ทอีสเทิร์น ซึ่งศึกษาการตีความการทำงานของโมเดลภาษา กล่าวว่า เป็นเรื่องยากมากที่จะกำหนดว่า “คำ” ควรถูกแบ่งอย่างไรสำหรับเอไอ
ต่อให้ผู้เชี่ยวชาญสามารถออกแบบระบบแบ่งโทเคนที่สมบูรณ์แบบได้ โมเดลเอไอก็อาจยังพยายามแบ่งข้อมูลออกเป็นชิ้นเล็กลงไปอีกอยู่ดี เพราะนั่นเป็นวิธีที่ระบบเรียนรู้รูปแบบของภาษา
ฟอยชต์ มองว่า อาจไม่มีสิ่งที่เรียกว่า “ตัวแบ่งโทเคนที่สมบูรณ์แบบ” สำหรับภาษาเลย เนื่องจากภาษาเองก็มีความคลุมเครือและยืดหยุ่นอยู่ตลอดเวลา
ปัญหาสะกดคำอาจไม่สำคัญที่สุด แต่สะท้อนข้อจำกัดของเอไอ
ในมุมของนักวิจัยเอไอ ปัญหาการสะกดคำอาจไม่ใช่ประเด็นเร่งด่วนที่สุด เพราะคุณค่าหลักของโมเดลภาษาไม่ได้อยู่ที่ความสามารถในการนับตัวอักษร
อย่างไรก็ตาม ความผิดพลาดที่เห็นได้ชัดเจนเช่นนี้ กลายเป็นเครื่องเตือนว่าระบบเอไอยังไม่ได้เข้าใจภาษาเหมือนมนุษย์ แม้บางครั้งมันจะสร้างคำตอบที่ดูฉลาดหรือดูเหมือนรู้ทุกอย่างก็ตาม
กรณีของ AI Overview ของกูเกิลยังสะท้อนคำถามสำคัญต่อกระแสการผลักดันเอไอเข้าไปอยู่ในบริการหลักของบริษัทเทคโนโลยีทั่วโลก ว่าระบบที่สามารถตอบคำถามได้อย่างรวดเร็วและดูน่าเชื่อถือนั้น อาจยังมีข้อผิดพลาดพื้นฐานที่ผู้ใช้ทั่วไปมองไม่เห็น และเมื่อเอไอเริ่มถูกใช้เป็นตัวกลางในการค้นหาข้อมูล ความผิดพลาดเล็กๆ ที่ดูเหมือนเรื่องตลก ก็อาจกลายเป็นปัญหาใหญ่ได้ หากผู้ใช้งานเชื่อคำตอบของระบบโดยไม่ตรวจสอบข้อมูลเพิ่มเติม
อ้างอิง: Techcrunch และ Mashable


