ทำไม AI ของ Google ถึงสะกดคำว่า Google ผิด? ทั้งที่แก้โจทย์คณิตศาสตร์ซับซ้อนได้

กัญญาภัค ทิศศรี

หากถามเอไอของ กูเกิล (Google) ว่า ในคำว่า Google มีตัวอักษร P กี่ตัว คำตอบที่คนส่วนใหญ่น่าจะตอบได้ทันทีคือ “ไม่มีเลย” แต่คำตอบจากระบบ AI Overview ของกูเกิลกลับตอบว่า “มี 2 ตัว”

กรณีนี้กลายเป็นตัวอย่างที่ถูกแชร์ต่อกันบนโลกออนไลน์ หลังผู้ใช้งานจำนวนมากเริ่มทดลองค้นหาคำง่ายๆ ผ่านระบบค้นหาแบบใหม่ของกูเกิลที่ใช้ปัญญาประดิษฐ์สร้างคำตอบสรุปอัตโนมัติด้านบนผลการค้นหา หรือที่เรียกว่า AI Overview

นอกจากคำว่า Google แล้ว ระบบยังตอบผิดในคำอื่นๆ ด้วย เช่น หากถามคำว่า “poop” มีตัวอักษร r หนึ่งตัว ทั้งที่ไม่มีเลย หรือบอกว่าคำว่า journalism มีตัว d สองตัว แต่เมื่อสะกดคำออกมากลับเขียนเป็น “j-o-u-r-n-a-d-i-s-m” ซึ่งสะกดผิดไปจากเดิม

อีกตัวอย่างหนึ่ง ระบบสามารถตอบได้ว่าชื่อสกุลของประธานาธิบดีสหรัฐมีตัว P หนึ่งตัว แต่กลับสะกดคำว่า Trump ออกมาเป็น “t-r-p-u-m” ปัญหาเหล่านี้กลายเป็นที่วิพากษ์วิจารณ์ เพราะเป็นความผิดพลาดระดับพื้นฐาน ทั้งที่ระบบเอไอของกูเกิลถูกนำเสนอว่าเป็นก้าวสำคัญของอนาคตการค้นหาบนอินเทอร์เน็ต

ทำไม AI ของ Google ถึงสะกดคำว่า Google ผิด? ทั้งที่แก้โจทย์คณิตศาสตร์ซับซ้อนได้

ปัญหาที่ไม่ใช่เรื่องใหม่ของ Google Search

ก่อนหน้านี้ กูเกิลเคยเผชิญเสียงวิจารณ์มาแล้วเมื่อเปิดตัว AI Overview ครั้งแรก ระบบเคยดึงข้อมูลจากโพสต์ล้อเลียนของเว็บไซต์ข่าวเสียดสีอย่าง The Onion และกระทู้บน Reddit มาใช้เป็นคำตอบจริง รวมถึงเคยแนะนำให้ผู้ใช้งาน “กินหิน” หรือ “ใส่กาวลงบนพิซซ่า” เพื่อช่วยให้ชีสติดแน่นขึ้น

แม้กูเกิลจะปรับปรุงระบบหลายรอบ แต่ปัญหาความผิดพลาดของเอไอก็ยังเกิดขึ้นต่อเนื่อง โดยเฉพาะเมื่อบริษัทเดินหน้าผลักดันให้ Generative AI หรือเอไอที่สร้างข้อความได้เอง กลายเป็นหัวใจหลักของระบบค้นหาที่บริษัทพัฒนามานานเกือบ 30 ปี

กูเกิลให้สัมภาษณ์กับสำนักข่าว TechCrunch ผ่านอีเมลว่า “การนับตัวอักษรในคำเป็นปัญหาที่โมเดลภาษาขนาดใหญ่ (LLM) เผชิญกันมานาน และเรากำลังพยายามแก้ไขปัญหานี้อยู่”

ทำไมเอไอที่แก้โจทย์คณิตศาสตร์ได้ถึงนับตัวอักษรไม่ได้?

แม้เอไอรุ่นใหม่จะสามารถเขียนโปรแกรม สรุปบทความ หรือแก้โจทย์คณิตศาสตร์ที่ซับซ้อนได้ แต่เรื่องพื้นฐานอย่างการนับตัวอักษรกลับยังเป็นจุดอ่อนสำคัญ

วงการเอไอมีมุกที่ถูกพูดถึงมาหลายปีว่า เวลาบริษัทเปิดตัวโมเดลเอไอใหม่ วิธีทดสอบง่ายๆ คือถามว่า “คำว่า strawberry มีตัว r กี่ตัว” เพราะโมเดลจำนวนมากตอบผิด สาเหตุสำคัญมาจากวิธีการทำงานของโมเดลภาษา ซึ่งต่างจากวิธีที่มนุษย์อ่านภาษา

มนุษย์มองคำว่า Google เป็นชุดของตัวอักษร G-o-o-g-l-e และสามารถแยกนับตัวอักษรทีละตัวได้ แต่เอไอไม่ได้มองภาษาแบบนั้น

เอไอส่วนใหญ่ในปัจจุบันถูกสร้างบนสถาปัตยกรรมที่เรียกว่า Transformer โดยระบบจะไม่ได้อ่าน “ตัวอักษร” หรือ “คำ” แบบตรงไปตรงมา แต่จะเปลี่ยนข้อความทั้งหมดให้กลายเป็นหน่วยข้อมูลที่เรียกว่า โทเคน (token) ก่อน

โทเคนอาจเป็นทั้งคำเต็ม พยางค์ หรือบางครั้งอาจเป็นเพียงบางส่วนของคำ ขึ้นอยู่กับวิธีออกแบบโมเดล เมื่อผู้ใช้พิมพ์คำถามเข้าไป เอไอจะไม่เห็นตัวอักษรทีละตัวเหมือนมนุษย์ แต่จะเห็นเป็นชุดข้อมูลตัวเลขที่แทนความหมายของภาษา จากนั้นจึงคาดเดาคำตอบที่มีความเป็นไปได้สูงที่สุดตามรูปแบบข้อมูลที่เคยเรียนรู้มา

แมทธิว กัซเดียล (Matthew Guzdial) นักวิจัยด้านเอไอและผู้ช่วยศาสตราจารย์จากมหาวิทยาลัยอัลเบอร์ตา อธิบายกับ TechCrunch ว่า โมเดลภาษาไม่ได้อ่านข้อความจริงๆ

เขาระบุว่า เมื่อเอไอเห็นคำว่า “the” ระบบจะเข้าใจความหมายของคำทั้งคำ แต่ไม่ได้เข้าใจว่าในคำนั้นประกอบด้วยตัวอักษร T, H และ E กล่าวอีกแบบคือ เอไอเข้าใจความหมายรวมของภาษาได้ดีมาก แต่ไม่ได้เข้าใจโครงสร้างย่อยของคำในแบบเดียวกับมนุษย์

ข้อจำกัดที่อาจแก้ได้ยาก

นักวิจัยจำนวนหนึ่งมองว่าปัญหานี้อาจไม่ได้เป็นเพียงบั๊กเล็กๆ แต่เป็นข้อจำกัดที่ฝังอยู่ในโครงสร้างพื้นฐานของโมเดลภาษา

เชอริแดน ฟอยชต์ (Sheridan Feucht) นักศึกษาปริญญาเอกจากมหาวิทยาลัยนอร์ทอีสเทิร์น ซึ่งศึกษาการตีความการทำงานของโมเดลภาษา กล่าวว่า เป็นเรื่องยากมากที่จะกำหนดว่า “คำ” ควรถูกแบ่งอย่างไรสำหรับเอไอ

ต่อให้ผู้เชี่ยวชาญสามารถออกแบบระบบแบ่งโทเคนที่สมบูรณ์แบบได้ โมเดลเอไอก็อาจยังพยายามแบ่งข้อมูลออกเป็นชิ้นเล็กลงไปอีกอยู่ดี เพราะนั่นเป็นวิธีที่ระบบเรียนรู้รูปแบบของภาษา

ฟอยชต์ มองว่า อาจไม่มีสิ่งที่เรียกว่า “ตัวแบ่งโทเคนที่สมบูรณ์แบบ” สำหรับภาษาเลย เนื่องจากภาษาเองก็มีความคลุมเครือและยืดหยุ่นอยู่ตลอดเวลา

ปัญหาสะกดคำอาจไม่สำคัญที่สุด แต่สะท้อนข้อจำกัดของเอไอ

ในมุมของนักวิจัยเอไอ ปัญหาการสะกดคำอาจไม่ใช่ประเด็นเร่งด่วนที่สุด เพราะคุณค่าหลักของโมเดลภาษาไม่ได้อยู่ที่ความสามารถในการนับตัวอักษร

อย่างไรก็ตาม ความผิดพลาดที่เห็นได้ชัดเจนเช่นนี้ กลายเป็นเครื่องเตือนว่าระบบเอไอยังไม่ได้เข้าใจภาษาเหมือนมนุษย์ แม้บางครั้งมันจะสร้างคำตอบที่ดูฉลาดหรือดูเหมือนรู้ทุกอย่างก็ตาม

กรณีของ AI Overview ของกูเกิลยังสะท้อนคำถามสำคัญต่อกระแสการผลักดันเอไอเข้าไปอยู่ในบริการหลักของบริษัทเทคโนโลยีทั่วโลก ว่าระบบที่สามารถตอบคำถามได้อย่างรวดเร็วและดูน่าเชื่อถือนั้น อาจยังมีข้อผิดพลาดพื้นฐานที่ผู้ใช้ทั่วไปมองไม่เห็น และเมื่อเอไอเริ่มถูกใช้เป็นตัวกลางในการค้นหาข้อมูล ความผิดพลาดเล็กๆ ที่ดูเหมือนเรื่องตลก ก็อาจกลายเป็นปัญหาใหญ่ได้ หากผู้ใช้งานเชื่อคำตอบของระบบโดยไม่ตรวจสอบข้อมูลเพิ่มเติม

อ้างอิง: Techcrunch และ Mashable

กัญญาภัค ทิศศรี

ผู้สื่อข่าว Tech AI เกาะติดข่าวความเคลื่อนไหว เทคโนโลยี AI ทั้งในประเทศไทยและทั่วโลก