อาลีบาบา เปิดตัว EMO เอไอสร้างวิดีโอร้องเพลงจากภาพบุคคล หวังสู้ศึก GenAI

อาลีบาบา เปิดตัว EMO เอไอสร้างวิดีโอร้องเพลงจากภาพบุคคล หวังสู้ศึก GenAI

อาลีบาบา บิ๊กเทคจากจีน เปิดเผยโมเดล “EMO” เอไอแปลงภาพบุคคลเป็นวิดีโอที่สามารถร้องเพลง ขยับปาก แสดงสีหน้าท่าทางได้ หวังสู้ Sora ของ OpenAI

สมรภูมิเจนเอไอยังคงเดือด หลังการเปิดตัว Sora ของ OpenAI บริษัทเทคโนโลยีหลายเจ้ามีแผนสร้างเอไอครีเอเตอร์เป็นของตนเอง หนึ่งในนั้นคือ อาลีบาบา บริษัทยักษ์ใหญ่ด้านเทคโนโลยีจากประเทศจีน 

โดยหน่วยงานวิจัย Intelligent Computing ของอาลีบาบา ออกมาเปิดเผยว่า กำลังเตรียมสร้าง “EMOเอไอสร้างวิดีโอ ใช้แค่ภาพบุคคลเพียง 1 ภาพ ก็สามารถสร้างตัวละครที่ร้องเพลง พูด ขยับใบหน้า แสดงสีหน้าท่าทางต่างๆ ได้

การเจนวิดีโอของ EMO ใช้รูปภาพบุคคลพร้อมกับไฟล์เสียงที่ต้องการให้ตัวละครพูดคุย ซึ่งสามารถสร้างความยาวสูงสุด 1 นาที 30 วินาที การแสดงออกของสีหน้าบุคคลมีอารมณ์ร่วมกับเสียงที่ออกมาด้วย ไม่ใช่แค่การขยับปากนิ่งๆ เท่านั้น

สำหรับฟังก์ชันให้ตัวละครร้องเพลง สามารถปรับได้ตามภาษาของเพลง ตลอดจนมีการขยับตามจังหวะเพลงที่รวดเร็ว ทั้งนี้ เอไอยังสามารถแยกแยะเสียงภาษาอังกฤษ และเกาหลีได้ 

EMO ถูกคาดคะเนว่าย่อมาจาก Emotive Portrait Alive แต่ในกรณีนี้ ทำไมจึงไม่เรียกว่า EPO? การเล่นคำว่า “EMO (อีโม)” เป็นการสร้างจุดเด่นให้กับเอไอของตน กล่าวคือ ตัวละครในวิดีโอที่สร้างโดย EMO จะสามารถพูดคุย และร้องเพลงได้ แต่คู่แข่งอย่าง Sora ไม่สามารถพูดคุยได้ 

อาลีบาบา เปิดตัว EMO เอไอสร้างวิดีโอร้องเพลงจากภาพบุคคล หวังสู้ศึก GenAI  

“แทนที่จะสร้างแค่ตัวละคร-นักแสดงมองหน้ากันไปมา ทำไมถึงไม่สร้างให้พูดคุยกันได้? EMO จึงเป็นอนาคตของเอไอที่สามารถสร้างสรรค์โลกเสมือนจริง โดยมีตัวละครที่สามารถโต้ตอบกลับได้อย่างมีชีวิตชีวา” ทีมผู้สร้าง EMO กล่าว 

EMO นำเสนอตัวอย่างวิดีโอที่เจนขึ้นคือ คลิปผู้หญิงญี่ปุ่นเดินบนถนนที่สร้างจาก Sora แต่ EMO ทำให้ผู้หญิงคนนั้นร้องเพลงได้ ซึ่ง Don’t Start Now ของ Dua Lipa เป็นเพลงที่เธอร้อง

อย่างไรก็ตาม โมเดล EMO ยังอยู่ในขั้นตอนของการพัฒนา และต้องเข้ากระบวนการด้านจริยธรรมเช่นเดียวกับ Sora โดยคลิปตัวอย่างที่ EMO เจนขึ้นมานั้นส่วนใหญ่ตัวละครไม่ได้แสดงอารมณ์รุนแรง เช่น โกรธจัด หรือร้องไห้หนัก 

อาลีบาบามุ่งมั่นที่จะเป็นผู้นำด้านเทคโนโลยีเอไอของโลก โดยตั้งเป้าหมายที่จะใช้เอไอขับเคลื่อนธุรกิจให้เติบโต สร้างสรรค์นวัตกรรมใหม่ และยกระดับคุณภาพชีวิตของผู้คน โดยนวัตกรรมที่ผ่านมาคือ การพัฒนาโมเดลภาษาขนาดใหญ่ WuDao 2.0 ที่มีความสามารถเทียบเท่า GPT-3 ของ OpenAI, การเปิดตัว Alibaba AI Academy สถาบันฝึกอบรมด้านเอไอ และการร่วมลงทุนกับมหาวิทยาลัยชั้นนำทั่วโลกเพื่อพัฒนาเทคโนโลยีเอไอ

อ้างอิง: timesofindia sea.mashable cloudbooklet

พิสูจน์อักษร....สุรีย์  ศิลาวงษ์