Google กลับสู่สนาม AI แบบเปิดน้ำหนัก ด้วย Gemma 4 หลังจีนครองตลาดกว่าหนึ่งปี

กูเกิล (Google) เปิดตัว Gemma 4 ซึ่งเป็นโมเดลเอไอแบบเปิดเผยค่าน้ำหนักของโมเดล (Open-weight) และปล่อยภายใต้สัญญาอนุญาตแบบ Apache 2.0 ทำให้นักพัฒนา และบริษัทต่างๆ สามารถดาวน์โหลด นำไปแก้ไข ดัดแปลง หรือใช้สร้างผลิตภัณฑ์เชิงพาณิชย์ได้อย่างเสรี

Gemma 4 ถูกพัฒนาจากงานวิจัย และเทคโนโลยีชุดเดียวกับโมเดลเอไอหลักของกูเกิลอย่าง Gemini ซึ่งเป็นเอไอที่บริษัทนำไปใช้ในบริการต่างๆ ของตัวเอง เช่น Google Search, Gmail, Google Docs และ Google Cloud

อย่างไรก็ตาม จุดประสงค์ของทั้งสองโมเดลแตกต่างกัน โดย Gemini เป็นโมเดลเชิงพาณิชย์ที่ให้บริการผ่านระบบคลาวด์และมักต้องสมัครใช้งานผ่านบริการของบริษัท ขณะที่ Gemma ถูกออกแบบให้เป็นโมเดลแบบเปิดที่นักพัฒนาสามารถดาวน์โหลดไปรันบนฮาร์ดแวร์ของตัวเองได้โดยตรง แม้ไม่มีการเชื่อมต่ออินเทอร์เน็ต

กูเกิลระบุว่า Gemma 4 เป็นโมเดลแบบเปิดที่มีความสามารถสูงที่สุดของบริษัทในปัจจุบัน โดยถูกออกแบบให้รองรับงานวิเคราะห์ที่ซับซ้อนมากขึ้น เช่น การวางแผนหลายขั้นตอน การใช้เหตุผลเชิงตรรกะ และการทำงานร่วมกับเครื่องมือหรือระบบอื่นในลักษณะเอไออัตโนมัติ

Gemma 4 ยังได้รับการปรับปรุงด้านคณิตศาสตร์ ความสามารถในการทำตามคำสั่งที่ซับซ้อน รวมถึงรองรับงานสร้างโคด การวิเคราะห์ภาพ วิดีโอ และเสียงพูด นอกจากนี้ยังถูกฝึกด้วยข้อมูลมากกว่า 140 ภาษา ทำให้นักพัฒนาสามารถสร้างแอปพลิเคชันเอไอสำหรับผู้ใช้ทั่วโลกได้ง่ายขึ้น

หนึ่งปีที่ผ่านมา โมเดลจีนกินรวบ

การเปิดตัว Gemma 4 เกิดขึ้นในช่วงเวลาที่การแข่งขันในตลาดโมเดลเอไอแบบเปิดซอร์สโคดกำลังรุนแรงขึ้น โดยเฉพาะจากบริษัทเทคโนโลยีจีน

ช่วงปี 2567 ถึงต้นปี 2569 โมเดลโอเพนซอร์สที่ได้รับความนิยมในหมู่นักพัฒนาทั่วโลกจำนวนมากมาจากจีน เช่น DeepSeek, Qwen ของบริษัท Alibaba, รวมถึงโมเดลอย่าง GLM และ Minimax

ข้อมูลจากสำนักข่าว Decrypt ระบุว่า ปลายปี 2567 โมเดลจากจีนมีสัดส่วนการใช้งานเพียงประมาณ 1.2% ของตลาดโลก แต่ภายในเวลาเพียงหนึ่งปี ตัวเลขดังกล่าวเพิ่มขึ้นเป็นประมาณ 30% ภายในสิ้นปี 2568

หนึ่งในเหตุการณ์สำคัญคือ การที่ Qwen แซงหน้า Llama ซึ่งเป็นโมเดลจากบริษัท Meta และเคยเป็นตัวเลือกยอดนิยมของนักพัฒนา

เดิมที Llama ถูกมองว่าเป็นโมเดลโอเพนซอร์สหลักสำหรับผู้ที่ต้องการนำเอไอไปติดตั้งบนเครื่องของตัวเอง แต่ในช่วงหลังนักพัฒนาบางส่วนเริ่มตั้งคำถามเกี่ยวกับเงื่อนไขใบอนุญาตใช้งาน เพราะเป็นสัญญาที่บริษัทกำหนดขึ้นเอง ทำให้องค์กรบางแห่งไม่แน่ใจว่าการนำไปใช้เชิงพาณิชย์จะมีข้อจำกัดหรือไม่

ขณะเดียวกัน ประสิทธิภาพของโมเดลจากจีนก็พัฒนาอย่างรวดเร็ว ทำให้การแข่งขันในตลาดโมเดลเอไอแบบเปิดเริ่มเปลี่ยนทิศทาง

ความพยายามจากฝั่งสหรัฐ

ในฝั่งสหรัฐมีความพยายามพัฒนาโมเดลโอเพนซอร์สเพื่อแข่งขันกับโมเดลจีนเช่นกัน

ตัวอย่างหนึ่งคือ โมเดลตระกูล OLMo พัฒนาโดย Allen Institute for AI ซึ่งเป็นสถาบันวิจัยด้านเอไอในสหรัฐ อย่างไรก็ตาม โมเดลนี้ยังไม่ได้รับความนิยมในวงกว้าง

ต่อมาในเดือนสิงหาคม 2568 บริษัท OpenAI ได้เปิดตัวโมเดลแบบเปิดที่เรียกว่า gpt-oss ซึ่งช่วยกระตุ้นความสนใจของชุมชนนักพัฒนาได้ระดับหนึ่ง แต่โมเดลนี้ไม่ได้ถูกออกแบบมาเพื่อแข่งขันกับโมเดลระดับแนวหน้าของโลก

ก่อนหน้าการเปิดตัว Gemma 4 เพียงไม่นาน สตาร์ตอัปขนาดเล็กจากสหรัฐอย่าง Arcee AI ซึ่งมีพนักงานประมาณ 30 คน ได้เปิดตัวโมเดลโอเพนซอร์สชื่อ Trinity ที่มีขนาดประมาณ 400,000 ล้านพารามิเตอร์

การเปิดตัว Trinity ทำให้หลายคนมองว่าวงการเอไอโอเพนซอร์สในสหรัฐยังไม่หายไปจากการแข่งขัน และไม่นานหลังจากนั้นกูเกิลก็ประกาศเปิดตัว Gemma 4 ตามมา

รายละเอียด Gemma 4 ครอบคลุมตั้งแต่โทรศัพท์ถึงคลาวด์

Gemma 4 มาในสี่ขนาด แต่ละรุ่นออกแบบมาสำหรับฮาร์ดแวร์คนละระดับ

สองรุ่นเล็กคือ E2B และ E4B ออกแบบมาสำหรับโทรศัพท์แอนดรอยด์ คอมพิวเตอร์บอร์ดเดี่ยวอย่าง Raspberry Pi และอุปกรณ์ขนาดเล็กอื่นๆ จุดเด่นคือ ทำงานได้โดยไม่ต้องต่ออินเทอร์เน็ตเลย ตอบสนองแทบทันที รับคำสั่งเสียงได้โดยตรง และรองรับการสนทนาหรือเอกสารที่ยาวมากในคราวเดียว

สองรุ่นใหญ่คือ 26B และ 31B เหมาะสำหรับคอมพิวเตอร์ตั้งโต๊ะสเปกสูงหรือเซิร์ฟเวอร์ รุ่น 26B เน้นความเร็วในการตอบ ส่วนรุ่น 31B เน้นความแม่นยำ และคุณภาพของคำตอบ

ทั้งสองรุ่นรองรับเอกสารที่ยาวกว่ารุ่นเล็กเป็นสองเท่า และสามารถเชื่อมต่อกับระบบภายนอกหรือสั่งให้ตอบในรูปแบบที่โปรแกรมอื่นนำไปใช้ต่อได้ทันที ซึ่งเป็นคุณสมบัติสำคัญสำหรับการพัฒนาเอไอที่ทำงานอัตโนมัติ

ทั้งสี่รุ่นอ่าน และวิเคราะห์ภาพกับวิดีโอได้ทั้งหมด รุ่น 26B และ 31B ต้องการการ์ดจอระดับมืออาชีพจึงจะรันแบบเต็มประสิทธิภาพได้ แต่ก็มีเวอร์ชันที่บีบอัดขนาดลงสำหรับผู้ที่ใช้การ์ดจอทั่วไปตามบ้านด้วย

ผลการทดสอบ

แพลตฟอร์ม Arena AI เป็นเว็บไซต์ที่วงการเอไอใช้จัดอันดับโมเดลโดยให้ผู้ใช้จริงเปรียบเทียบคำตอบของโมเดลแบบไม่รู้ว่าโมเดลไหนตอบอะไร แล้วโหวตว่าชอบคำตอบไหนมากกว่า ผลที่ออกมาสะท้อนความพึงพอใจของผู้ใช้จริง ไม่ใช่แค่คะแนนจากชุดทดสอบในห้องแล็บ

บนแพลตฟอร์มนี้ รุ่น 31B ของ Gemma 4 อยู่ อันดับ 3 และรุ่น 26B อยู่ อันดับ 6 ในบรรดาโมเดลโอเพนซอร์สทั้งหมดที่มีอยู่ในตลาด

กูเกิลอ้างว่า ทั้งสองรุ่นให้ผลลัพธ์ที่สูสีกับโมเดลที่มีขนาดใหญ่กว่าถึง 20 เท่า ซึ่งหมายความว่า โมเดลขนาดกะทัดรัดกว่านี้ต้องการฮาร์ดแวร์น้อยกว่า ค่าใช้จ่ายในการรันต่ำกว่า แต่ยังได้ผลลัพธ์ในระดับใกล้เคียงกัน ตัวเลขจาก Arena AI ก็สนับสนุนคำอ้างนี้ อย่างไรก็ตาม อันดับ 1 และ 2 ยังคงเป็นโมเดลจากจีน

ทีมงานผู้เขียนข่าวของ Decrypt ทดลองใช้ Gemma 4 และพบว่าโมเดลมีทั้งจุดแข็ง และจุดอ่อนที่ชัดเจน โมเดลมีแนวโน้มเปิดกระบวนการคิดวิเคราะห์เชิงลึกแม้กับคำถามที่ไม่ได้ซับซ้อน ทำให้คำตอบสำหรับเรื่องง่ายๆ บางครั้งยาว และวกวนเกินกว่าที่ควรจะเป็น

งานเขียนสร้างสรรค์อยู่ในระดับพอใช้ได้ ไม่ได้โดดเด่นเป็นพิเศษ แต่ทีมงานระบุว่าผลลัพธ์น่าจะดีขึ้นได้หากผู้ใช้ระบุรายละเอียดในคำสั่งให้ชัดเจนกว่านี้

ส่วนการเขียนโคดคือ จุดที่ทำได้ดีที่สุด เมื่อสั่งให้สร้างเกม โมเดลสร้างโคดที่รันได้ทันทีโดยไม่มีข้อผิดพลาดตั้งแต่ครั้งแรก ซึ่งในวงการพัฒนาซอฟต์แวร์ถือว่าสำคัญมาก เพราะโคดที่รันได้เลยโดยไม่ต้องแก้บั๊กช่วยประหยัดเวลาได้มากกว่าโคดที่ดูสวยงามแต่ต้องมานั่งแก้ไขทีหลัง

เรื่องสัญญาอนุญาต ทำไมถึงสำคัญ?

เวลาที่บริษัทปล่อยโมเดลเอไอให้คนอื่นใช้ฟรี สิ่งที่กำหนดว่า “ใช้ได้แค่ไหน” คือ สัญญาอนุญาต ซึ่งเปรียบได้กับกฎของบ้านที่เจ้าของบ้านวางไว้ บางสัญญาเปิดกว้าง บางสัญญามีข้อจำกัดที่ทำให้ใช้งานได้ยากในทางธุรกิจ

Gemma รุ่นก่อนหน้าใช้สัญญาที่กูเกิลร่างขึ้นเอง ปัญหาคือ สัญญาแบบนี้ไม่ใช่มาตรฐานที่วงการรู้จัก ทีมกฎหมายของบริษัทต่างๆ จึงต้องเสียเวลาตีความว่าทำอะไรได้หรือไม่ได้ และหลายบริษัทเลือกที่จะไม่แตะเลยดีกว่า เพื่อหลีกเลี่ยงความเสี่ยงทางกฎหมาย

Apache 2.0 ต่างออกไปอย่างสิ้นเชิง เป็นสัญญามาตรฐานที่วงการซอฟต์แวร์โอเพนซอร์สใช้กันมานานหลายสิบปี สามารถนำไปแก้ไข ดัดแปลง แจกจ่าย หรือสร้างเป็นผลิตภัณฑ์เชิงพาณิชย์ได้เลยโดยไม่ต้องขออนุญาตเพิ่ม และที่สำคัญคือ กูเกิลไม่มีสิทธิย้อนกลับมาเปลี่ยนเงื่อนไขกับโคดที่ปล่อยออกไปแล้ว

ความเปลี่ยนแปลงนี้ได้รับการตอบรับดีจากวงการ เคลมองต์ เดอลองก์ (Clement Delangue) ผู้ร่วมก่อตั้งแพลต Hugging Face ซึ่งเป็นแพลตฟอร์มหลักที่นักพัฒนาเอไอทั่วโลกใช้แบ่งปัน และดาวน์โหลดโมเดล ออกมาแสดงความชื่นชม โดยกล่าวว่า เอไอที่รันในเครื่องของตัวเองกำลังก้าวเข้าสู่จุดเปลี่ยนสำคัญ และมองว่านี่คือ ทิศทางที่อุตสาหกรรมกำลังมุ่งหน้าไป

ด้าน เดมิส ฮัสซาบิส (Demis Hassabis) ซีอีโอของ Google DeepMind กล่าวว่า Gemma 4 คือ โมเดลโอเพนซอร์สที่ดีที่สุดในโลกเมื่อเทียบในขนาดเดียวกัน

ปัจจุบัน Gemma 4 เปิดให้ทดลองใช้งานผ่าน Google AI Studio และสามารถดาวน์โหลดโมเดลได้จากแพลตฟอร์มสำหรับนักพัฒนา เช่น Hugging Face, Kaggle และ Ollama เพื่อให้ผู้พัฒนานำไปทดลองหรือสร้างแอปพลิเคชันเอไอต่อได้ทันที

อ้างอิง: Google Decrypt และ Mashable

พิสูจน์อักษร....สุรีย์ ศิลาวงษ์