วันอังคาร ที่ 10 มีนาคม 2569

Login
Login

BDI เร่งปั้น 'ThaiLLM' โมเดลภาษาไทยหวังดัน สู่โครงสร้างพื้นฐาน AI แห่งชาติ

BDI เร่งปั้น 'ThaiLLM' โมเดลภาษาไทยหวังดัน สู่โครงสร้างพื้นฐาน AI แห่งชาติ

สถาบันข้อมูลขนาดใหญ่ (องค์การมหาชน) หรือ BDI ภายใต้การนำของ ธีรณี อจลากุล เผยโครงการ ThaiLLM (Thai Large Language Model) ซึ่งมีสถานะความพร้อมแล้วกว่า 70 % โดยในเวอร์ชันแรกโมเดลได้ถูกติดตั้งไว้ในระบบคลาวด์ของบริษัท โทรคมนาคมแห่งชาติ (NT) เพื่อให้สตาร์ทอัพ นักพัฒนา และหน่วยงานที่เกี่ยวข้องเข้าถึงและใช้งานฟรีได้ทันที ช่วงต่อมาคาดว่าจะเปิดให้ประชาชนทั่วไปใช้งานได้ภายในเดือนกุมภาพันธ์ 2569

โดยในเฟสแรก BDI ได้ตั้งงบประมาณไว้ที่ 89 ล้านบาท ใช้เวลากว่า 1.5 ปี โดยจะเน้นนำร่องใช้งานใน 2 อุตสาหกรรมหลักของไทย คือ การแพทย์ และ การท่องเที่ยว 

ซึ่งถือเป็นจุดแข็งสำคัญของประเทศ ก่อนจะเปิดโอกาสระดมทุนเพิ่มเติมสำหรับการใช้งานคลาวด์และฝึกปรับปรุงโมเดลในระยะยาว ปัจจุบันเอง มีผู้ให้บริการคลาวด์และภาคเอกชนจำนวนหนึ่งแสดงความสนใจเข้าร่วมสนับสนุนในเฟสถัดไปแล้ว

นอกจากนี้ BDI ได้เริ่มรับบริจาคข้อมูลจากหน่วยงานต่าง ๆ เช่น ข้อมูลจากหน่วยงานภาครัฐ ธนาคาร (ข้อมูลที่ไม่เกี่ยวข้องกับลูกค้า) และสื่อมวลชน เพื่อใช้ฝึกโมเดลให้เข้าใจบริบทภาษาไทยในวงกว้าง รวมถึงร่วมมือในการพัฒนาระบบตรวจจับข่าวปลอม (Fake News Detection) เพื่อให้โมเดลสามารถแยกแยะระหว่างข่าวจริงและข่าวปลอมได้แม่นยำยิ่งขึ้น

นอกจากนี้ BDI ยังเปิดโอกาสให้ภาคสื่อมวลชนและกลุ่มผู้ใช้งานเสนอโจทย์หรือคำถามที่ต้องการให้ระบบตอบได้ถูกต้องและมีเหตุผล ซึ่งจะเป็นหนึ่งในกระบวนการที่ช่วยให้โมเดล “เรียนรู้” ภาษาไทยได้ลึกซึ้งมากขึ้นและปรับตัวให้เข้าใจบทสนทนาหรือคำถามในชีวิตจริงได้ดีกว่าเดิม

เธอ เสริมว่า ภายในปี 2570 โมเดล ThaiLLM จะเริ่มสร้างรายได้ โดยเปิดให้หน่วยงานรัฐและเอกชนใช้บริการ custom training เพื่อสร้างแชตบอทเฉพาะทาง เช่น แชตบอทด้านกฎหมาย ระบบตอบคำถามนโยบายรัฐ หรือแชตบอทให้บริการภายในองค์กร โดยไม่จำเป็นต้องฝึกโมเดลตั้งต้น ช่วยประหยัดต้นทุนและเวลาในการพัฒนาได้อย่างมาก

ThaiLLM ถือเป็นครั้งแรกที่ภาครัฐลุกขึ้นมาสร้างโมเดลภาษาไทยโดยพลังร่วมจากทุกภาคส่วน เป้าหมายไม่ใช่แข่งขันกับ ChatGPT หรือ Gemini แต่เป็นการสร้างระบบเปิด ที่ทุกคนสามารถต่อยอดได้ เป็นโครงสร้างพื้นฐานด้านภาษาแห่งชาติ ไม่ต้องเสียค่าบริการรายเดือน และไม่มุ่งหวังกำไร 

ในด้านความเสี่ยงและอุปสรรค โครงการ ThaiLLM เคยถูกตั้งคำถามว่าอาจโดน “หั่นงบ” ถึง 20% ในบางช่วง ซึ่งอาจกระทบต่อแผนดำเนินงานโดยรวมของโครงการ AI ภาษาไทย อย่างไรก็ตาม BDI ยืนยันว่า โครงการดังกล่าวอยู่ระหว่างการประสานความร่วมมือกับหน่วยงานภาคเอกชน เพื่อประคองการลงทุนและเสริมสร้างความยั่งยืน

นอกจากนี้ ยังมีแนวทางที่จะเปิดให้ใช้งานแบบ โอเพ่นซอร์ส เพื่อให้หน่วยงาน สถาบันการศึกษา นักวิจัย และผู้ประกอบการสามารถนำโมเดลไปพัฒนา ปรับแต่ง หรือใช้งานต่อได้อย่างอิสระ  

เธอ เสริมว่า BDI กำลังดำเนินการเตรียมงานแถลงเปิดตัว ThaiLLM ซึ่งคาดว่าจะจัดขึ้นในช่วงกลางเดือนธันวาคม 2568 ถึงต้นเดือนมกราคม 2569 ขึ้นอยู่กับความพร้อมของหน่วยงานที่เกี่ยวข้อง โดยถือเป็นอีกหนึ่งก้าวสำคัญสำหรับประเทศไทยในการเข้าสู่ยุค AI ที่ขับเคลื่อนด้วยโมเดลภาษาไทยของตัวเองอย่างเต็มรูปแบบ

ในภาพรวม โครงการ ThaiLLM เป็นความร่วมมือระหว่าง BDI, NECTEC, VISTEC, AIEAT และ AIAT เพื่อเดินหน้าเปลี่ยนแนวคิด “ผู้ใช้งานไทยต้องพึ่งโมเดลต่างประเทศ” ไปสู่ยุคที่ประเทศไทยมีโครงสร้างพื้นฐาน AI ภาษาของตัวเอง โดยมุ่งหวังว่าจะช่วยลดต้นทุน สร้างนวัตกรรมใหม่ ๆ และเพิ่มศักยภาพการแข่งขันทางเทคโนโลยีของประเทศในระยะยาว