AWS เลือก ‘ไต้ฝุ่น’ โมเดลเอไอไทยหนึ่งเดียวในอาเซียน เข้าร่วม Accelerator

AWS เลือก ‘ไต้ฝุ่น’ โมเดลเอไอไทยหนึ่งเดียวในอาเซียน เข้าร่วม Accelerator

อะเมซอน เว็บ เซอร์วิสเซส (AWS) คัดเลือก ‘ไต้ฝุ่น’ โมเดลเอไอภาษาไทยจาก เอสซีบี เท็นเอ็กซ์ (SCB 10X) เป็นตัวแทนหนึ่งเดียวจากภูมิภาคเอเชียตะวันออกเฉียงใต้เข้าร่วมโครงการ AWS Generative AI Accelerator

KEY

POINTS

  • AWS คัดเลือก ‘ไต้ฝุ่น’ โมเดลเอไอภาษาไทยจาก SCB 10X เป็นตัวแทนหนึ่งเดียวจากภูมิภาคเอเชียตะวันออกเฉียงใต้เข้าร่วมโครงการ AWS Generative AI Accelerator
  • โครงการนี้เป็นโปรแกรมสนับสนุนสตาร์ตอัปเอไอระยะเวลา 8 สัปดาห์ เพื่อให้คำปรึกษาด้านเทคนิค การพัฒนาผลิตภัณฑ์ และการเข้าถึงเครือข่ายลูกค้าทั่วโลก
  • ไต้ฝุ่นเป็นโมเดลโอเพนซอร์สที่พัฒนาขึ้นเพื่อแก้ปัญหาความซับซ้อนของภาษาไทยโดยเฉพาะ ซึ่งโมเดลจากต่างประเทศยังทำได้ไม่ดีพอ
  • ความร่วมมือกับ AWS จะช่วยให้ไต้ฝุ่นสามารถขยายบริการและนำโมเดลไปใช้งานจริงในระดับภูมิภาคได้อย่างมีประสิทธิภาพมากขึ้น

บริษัท อะเมซอน เว็บ เซอร์วิสเซส (AWS) เปิดเผยรายชื่อทีมที่ได้รับคัดเลือกเข้าร่วมโครงการสนับสนุนสตาร์ตอัปด้านปัญญาประดิษฐ์ประจำปี 2568 ในชื่อ AWS Generative AI Accelerator ซึ่งเป็นโปรแกรมระยะเวลาแปดสัปดาห์ที่ให้คำปรึกษาทั้งด้านเทคนิค พื้นฐานคลาวด์ การพัฒนาผลิตภัณฑ์ และการเข้าถึงเครือข่ายลูกค้าองค์กรทั่วโลก 

หนึ่งในทีมที่ถูกคัดเลือกจากภูมิภาคเอเชียตะวันออกเฉียงใต้เพียงรายเดียวคือ “ไต้ฝุ่น (Typhoon)” โครงการพัฒนาเอไอแบบโอเพนซอร์สจาก เอสซีบี เท็นเอ็กซ์ (SCB 10X) ซึ่งเป็นกลุ่มวิจัยด้านเทคโนโลยีของไทยที่ทำงานกับระบบภาษาธรรมชาติอย่างต่อเนื่องในช่วงหลายปีที่ผ่านมา

วัตสัน ถิรภัทรพงศ์ ผู้จัดการประจำประเทศไทย AWS อธิบายว่า AWS ทำงานกับสตาร์ตอัปมาโดยตลอด เพราะมองว่ากลุ่มนี้เป็นผู้สร้างเทคโนโลยีใหม่อยู่เสมอ เขาย้อนให้ฟังว่าโครงการเริ่มต้นตั้งแต่ปี 2556 และจนถึงปัจจุบันมีสตาร์ตอัปเข้าร่วมกว่า 330,000 รายทั่วโลก มูลค่าการสนับสนุนรวมมากกว่า 7,000 ล้านดอลลาร์

ดังนั้น AWS จึงมองว่าการคัดเลือกทีมอย่างไต้ฝุ่นเข้ามาในโครงการปีนี้เป็นส่วนหนึ่งของความตั้งใจที่จะช่วยให้สตาร์ตอัปไทยเข้าถึงเทคโนโลยี คลาวด์ เครื่องมือด้านเอไอ และผู้เชี่ยวชาญได้มากขึ้น

จุดเริ่มต้นของไต้ฝุ่น

กสิมะ ธารพิพิธชัย หัวหน้าฝ่ายกลยุทธ์ด้านปัญญาประดิษฐ์ของ SCB 10X เล่าถึงจุดเริ่มต้นของโครงการไต้ฝุ่นว่า มาจากการเผชิญกับความท้าทายที่ปรากฏชัดเจนในวงการวิจัยและพัฒนาระบบประมวลผลภาษาธรรมชาติ โดยเฉพาะสำหรับภาษาไทย

ปัญหาหลักที่พบคือ ภาษาไทยมีข้อมูลสำหรับการฝึกโมเดลเอไออยู่ในปริมาณที่น้อยมากเมื่อเปรียบเทียบกับภาษาหลักๆ ทั่วโลก โมเดลภาษาขนาดใหญ่ที่พัฒนาโดยบริษัทเทคโนโลยีชั้นนำจากต่างประเทศมักจะทำงานได้ดีเยี่ยมเฉพาะกับภาษาอังกฤษ แต่กลับไม่สามารถรับมือกับความซับซ้อนและลักษณะเฉพาะของภาษาไทยได้อย่างมีประสิทธิภาพ

เช่น การอ่านและแปลงข้อความจากเอกสารราชการหรือเอกสารทางการที่มีการใช้ฟอนต์ภาษาไทยหลากหลายรูปแบบ การรู้จำเสียงพูดภาษาไทยที่มีความหลากหลายของสำเนียงตามภูมิภาคต่างๆ ทั่วประเทศ รวมไปจนถึงการแปลหรือการสลับไปมาระหว่างภาษาไทย และภาษาอังกฤษในการสนทนาที่เกิดขึ้นจริงใน 

ด้วยเหตุนี้ SCB 10X จึงตัดสินใจสร้างโมเดลภาษาไทยขึ้นมาใหม่ตั้งแต่ระดับพื้นฐาน โดยอาศัยความรู้และประสบการณ์จากการวิจัยของทีมเอง และที่สำคัญคือ ทีมได้เลือกที่จะเปิดเผยโมเดลนี้เป็นโอเพนซอร์ส เพื่อให้ผู้ใช้งานทั่วไป นักพัฒนาซอฟต์แวร์ และองค์กรต่างๆ ในประเทศไทยสามารถนำโมเดลไปใช้งาน ปรับแต่งให้เหมาะสมกับงานของตน หรือโฮสต์บนเซิร์ฟเวอร์ของตนเองได้โดยไม่มีข้อจำกัดด้านลิขสิทธิ์หรือค่าใช้จ่ายในการใช้งาน

การนำไต้ฝุ่นไปใช้งานจริง

ไต้ฝุ่นมีตัวอย่างการนำไปประยุกต์ใช้งานจริงในหลายมิติ ได้แก่ โรงพยาบาลศิริราช ซึ่งเป็นหนึ่งในสถาบันการแพทย์ชั้นนำของประเทศ ได้นำโมเดลไต้ฝุ่นไปพัฒนาเป็นระบบตอบคำถามอัตโนมัติสำหรับบุคลากรทางการแพทย์ โดยให้ความสำคัญกับการควบคุมความเป็นส่วนตัวและความปลอดภัยของข้อมูลผู้ป่วย 

บริษัท โตโยต้า ลีสซิ่ง (ประเทศไทย) นำระบบ OCR ของไต้ฝุ่นไปใช้เพื่อลดภาระงานด้านเอกสารที่ต้องทำด้วยมือ และนำข้อมูลที่ได้จากการแปลงไปวิเคราะห์เพื่อการตัดสินใจทางธุรกิจต่อไป ซึ่งช่วยเพิ่มประสิทธิภาพการทำงานและลดเวลาในการประมวลผลเอกสาร

นอกจากนี้ ยังมีโครงการที่มุ่งเน้นไปที่การพัฒนาทางด้านการศึกษา เช่น การพัฒนาแชทบอทสำหรับฝึกเตรียมสอบ PISA (Programme for International Student Assessment) ที่ช่วยให้นักเรียนสามารถฝึกทำข้อสอบและได้รับคำแนะนำแบบอัตโนมัติทันที 

ข้อได้เปรียบด้านต้นทุน

อีกมิติหนึ่งที่สำคัญมาก ทีมไต้ฝุ่นอธิบายว่า ข้อได้เปรียบที่สำคัญของโมเดลแบบโอเพนซอร์สคือ ผู้ใช้งานสามารถควบคุมและประหยัดต้นทุนการใช้งานได้

จากตัวเลขที่ทีมได้ประเมินไว้ เช่น ค่าใช้จ่ายในการใช้งานโมเดลบางรุ่นอยู่ที่ประมาณ 0.2 ดอลลาร์ต่อหนึ่งล้านโทเคน ซึ่งถือว่าต่ำมาก และในกรณีของโมเดลรู้จำเสียง (ASR) หากองค์กรตัดสินใจนำไปติดตั้งและรันบนเซิร์ฟเวอร์ของตนเอง ต้นทุนที่เกิดขึ้นจริงอาจถูกกว่าการใช้โซลูชันจากบริษัทเทคโนโลยีต่างประเทศได้หลายร้อยเท่า

ทีมยกตัวอย่างให้เห็นภาพที่ชัดเจนว่า หากมีการแปลงเสียงเป็นข้อความในปริมาณ 500,000 นาที (หรือประมาณ 8,333 ชั่วโมง) และเลือกรันผ่านระบบของ AWS โดยใช้โมเดลไต้ฝุ่น ค่าใช้จ่ายที่เกิดขึ้นอาจอยู่ที่เพียงประมาณ 12 ดอลลาร์เท่านั้น

ซึ่งต่างกับการใช้บริการจากผู้ให้บริการต่างประเทศที่อาจมีค่าใช้จ่ายสูงกว่านี้มาก นี่จึงเป็นเหตุผลสำคัญที่ทำให้องค์กรขนาดใหญ่ในประเทศไทยเริ่มให้ความสนใจและทดลองใช้โมเดลภาษาท้องถิ่นมากขึ้นเรื่อยๆ

แผนงานอนาคต

สำหรับแผนงานในระยะถัดไปของโครงการไต้ฝุ่น ทีมจะยังคงมุ่งเน้นไปที่การพัฒนาและแก้ไขจุดอ่อนหรือความต้องการสำคัญ (pain points) ของตลาดไทยเป็นหลัก

งานพัฒนาที่วางแผนไว้ประกอบด้วย การเพิ่มประสิทธิภาพของระบบ OCR ให้อ่านเอกสารได้แม่นยำและรวดเร็วยิ่งขึ้น การปรับปรุงระบบ ASR ให้สามารถรองรับสำเนียงและภาษาท้องถิ่นจากทุกภูมิภาคของประเทศได้มากขึ้น การปรับปรุงฐานข้อมูลความรู้ของโมเดลให้ทันสมัยอยู่เสมอ และการลดค่าใช้จ่ายในการรันบริการให้ต่ำลงอีก

โดยทีมมองทั้งสองรูปแบบของการให้บริการ คือ รูปแบบที่ผู้ใช้สามารถดาวน์โหลดไปโฮสต์เองบนเซิร์ฟเวอร์ของตนเอง ซึ่งให้การควบคุมเต็มที่ และรูปแบบการเรียกใช้งานผ่าน API หรือ endpoint ที่โฮสต์บนระบบคลาวด์ซึ่งสะดวกสบายและพร้อมใช้งานทันที

ทีมตั้งเป้าหมายไว้อย่างชัดเจนว่าจะรักษาต้นทุนการให้บริการให้อยู่ในระดับที่ต่ำพอที่องค์กรขนาดกลาง ธุรกิจขนาดเล็กและกลางจะสามารถเข้าถึงและใช้งานได้ เพราะหากต้องจ่ายค่าบริการรายเดือน

แม้จะเป็นจำนวนที่ดูไม่มากนักในแต่ละเดือน แต่เมื่อคูณด้วยจำนวนพนักงานทั้งหมดในองค์กรและระยะเวลาที่ใช้งานอย่างต่อเนื่องตลอดปี ค่าใช้จ่ายรวมที่เกิดขึ้นจริงอาจสูงมากจนกลายเป็นอุปสรรคหรือภาระที่หนักเกินไปต่อการนำเทคโนโลยีนี้ไปใช้งานจริงในองค์กรขนาดเล็กและกลาง

ความร่วมมือกับ AWS

กสิมะ อธิบายถึงความสำคัญของการร่วมมือกับ AWS ในโครงการ Accelerator ว่า เป็นการเปิดช่องทางที่สำคัญมากในด้านการผลิตซ้ำ และการขยายการให้บริการไปยังผู้ใช้งานที่กว้างขวางมากขึ้น

เหตุผลหลักมาจากการที่ AWS มีโครงสร้างพื้นฐานที่แข็งแกร่งและครอบคลุมทั่วภูมิภาคเอเชียตะวันออกเฉียงใต้ ทั้งในกรุงเทพมหานคร สิงคโปร์ จาการ์ตา กัวลาลัมเปอร์ และเมืองสำคัญอื่นๆ ในภูมิภาค ซึ่งช่วยแก้ปัญหาเรื่องความล่าช้าในการส่งข้อมูล เมื่อให้บริการกับผู้ใช้งานในภูมิภาคนี้ ทำให้การตอบสนองเร็วและราบรื่นกว่า

ผู้ใช้งานองค์กรมักถามคำถามสำคัญเกี่ยวกับ endpoint สำหรับการใช้งานจริง ข้อตกลงระดับการให้บริการที่รับประกันความพร้อมใช้งาน และการวางระบบที่สามารถให้บริการได้อย่างเสถียรและต่อเนื่องตลอดเวลา

สิ่งที่ AWS และเครือข่ายพาร์ทเนอร์สามารถให้การสนับสนุนได้คือ การจัดหาโครงสร้างพื้นฐานที่พร้อมใช้งานและมีมาตรฐานสูง รวมถึงช่องทางการตลาดและการเข้าถึงลูกค้า ทำให้โมเดลเอไอที่พัฒนามาอย่างยาวนานไม่ได้จบอยู่เพียงแค่ในห้องทดลองหรือระดับการวิจัย แต่สามารถนำไปใช้งานได้จริงและสร้างคุณค่าในสถานการณ์จริงที่หน้างานของลูกค้าขององค์กรต่างๆ ได้อย่างมีประสิทธิภาพ

มุมมองที่มีต่อตลาดเอไอ

มุมมองในระดับภูมิภาคแสดงให้เห็นว่า ตลาดโมเดลภาษาท้องถิ่นในอาเซียนยังไม่หนาแน่นและไม่มีการแข่งขันสูงเท่ากับตลาดในประเทศจีนหรือญี่ปุ่น ซึ่งมีผู้พัฒนาและบริษัทเทคโนโลยีจำนวนมาก โดยในภูมิภาคอาเซียนมีผู้เล่นที่ทำงานอย่างจริงจังอยู่ไม่กี่ราย เช่น ไต้ฝุ่นจากประเทศไทย และบางโครงการจากประเทศสิงคโปร์

“แม้ตอนนี้โฟกัสหลักของไต้ฝุ่นยังอยู่ที่ภาษาไทย แต่ทีมก็มีความร่วมมือด้านเทคนิคกับห้องปฏิบัติการในต่างประเทศเพื่อแชร์แนวทางการเก็บข้อมูลและการเทรนโมเดลสำหรับภาษาในภูมิภาค” กสิมะ กล่าว 

ด้านความเสี่ยงและการลงทุน ทั้ง AWS และทีมไต้ฝุ่นยอมรับว่า วงการเทคโนโลยีเอไอมีทั้งโอกาสและความเสี่ยง อาจมีฟองสบู่ด้านการลงทุนบางช่วง นักลงทุนจำเป็นต้องแยกแยะระหว่างการลงทุนในบริษัทที่มีพื้นฐานงานวิจัย และการลงทุนที่หวังผลลัพธ์เร็วทันที 

สำหรับทีมไต้ฝุ่นซึ่งตั้งอยู่ในองค์กรใหญ่ รูปแบบการทำงานจึงเน้นหนักไปที่การวิจัยต่อเนื่องและการพิสูจน์ทางเทคนิค มากกว่าการไล่หาเงินทุนแบบสตาร์ตอัปทั่วไป แต่การได้ไปอยู่ในโปรแกรมของ AWS ช่วยสร้างเครือข่ายนักลงทุนและลูกค้าระดับโลก ซึ่งอาจช่วยเร่งโอกาสในการนำผลิตภัณฑ์เข้าสู่ตลาดได้เร็วขึ้น

เป้าหมายของไต้ฝุ่นคือ การทำให้คนไทยมีเอไอที่เข้าใจภาษา วัฒนธรรม และปัญหาในชีวิตประจำวันของคนไทยจริงๆ ขณะที่ AWS มองบทบาทของตนเองว่าเป็นผู้สนับสนุนระบบนิเวศสตาร์ตอัปในไทย เพื่อให้เทคโนโลยีที่พัฒนาจากคนไทยสามารถก้าวสู่การใช้งานระดับภูมิภาคและระดับโลกได้มากขึ้น