Gemini Omni คืออะไร และวิธีใช้สร้างวิดีโอด้วย AI ทีละขั้นตอน 2026

26 พ.ค.
ยาว 2 นาที

Gemini Omni คืออะไร?

Gemini Omni คือโมเดลปัญญาประดิษฐ์ มัลติโมเดลตัวใหม่จาก Google ที่เปิดตัวอย่างเป็นทางการในงาน Google I/O 2026 เมื่อวันที่ 20 พฤษภาคม 2568 ถูกออกแบบสถาปัตยกรรมมาเพื่อรองรับการสร้างและปรับแต่งวิดีโอ สามารถทำได้อย่างครอบคลุมทุกรูปแบบ ทั้งข้อความ รูปภาพ เสียง และวิดีโอ

ความแตกต่างระหว่าง Gemini Omni กับ Veo

ทั้งสองโมเดลมีความแตกต่างกันอย่างชัดเจน โดย Veo จะเน้นที่การเปลี่ยนข้อความเป็นวิดีโอเฉยๆไม่สามารถคิดวิเคราะห์ได้ เป็นหลัก ในขณะที่ Gemini Omni ได้รวมความสามารถในการคิดวิเคราะห์เข้ากับการสร้างวิดีโอไว้ในโมเดลเดียว ทำให้เราสามารถพิมพ์สั่งปรับแก้รายละเอียดเฉพาะจุดในวิดีโอได้คล้ายกับ(หรือเอารูปสองรูปมารวมกันเป็นวีดีโอได้)

การแชทสั่งแก้งาน ฟีเจอร์นี้ช่วยแก้ปัญหาที่เวลาเราไม่ถูกใจเนื้อหาแค่บางส่วน แต่พอพิมพ์คำสั่งแก้ AI กลับสร้างวิดีโอชิ้นใหม่ที่ไม่เหมือนเดิมมาให้ทั้งหมด ด้วย Gemini Omni เราจึงสามารถสั่งแก้เฉพาะจุดที่บกพร่องบนวิดีโอต้นฉบับได้เลย ยกตัวอย่างเช่น หากสร้างวิดีโอ "จอมยุทธ์สู้กับแมว" แล้วได้ท่าทางต่อสู้ที่ไม่ถูกใจ เราก็สามารถพิมพ์บอกให้ AI ปรับแก้เฉพาะแอ็กชันตรงนั้นให้ตรงใจได้ทันที โดยที่องค์ประกอบอื่นๆ ยังคงเดิมและไม่ต้องเริ่มเจเนอเรตใหม่ตั้งแต่ต้น

(จำเป็นต้องใส่ข้อมูลให้ละเอียดถึงท่าทางและการกระทำจะยิ่งให้ AI สร้างได้แม่นมากขึ้น แค่สั่งสั้นๆจะทำให้ AI ทำท่าเองและไม่ตรงตามหลักความเป็นจริง เช่น สั่งให้กระโดดตีลังกาแต่เป็นกระโดดพลิกไปข้างหลังมาข้างหน้าเฉยๆ)

Gemini Omni มีกี่รุ่น

จากการอัปเดตล่าสุดในงาน Google I/O 2026 การเปิดตัวโมเดลตระกูล Omni ตอนนี้ คือ

Gemini Omni Flash — รุ่นแรกที่เปิดให้ใช้งานแล้ว Gemini Omni Flash คือโมเดลแรกในตระกูล Omni ที่ถูกปล่อยออกมาให้ใช้งานจริง ที่ผสานขีดความสามารถด้านการให้เหตุผลเข้ากับการสร้างสรรค์สื่อมัลติมีเดียได้ ณ วันที่ 20 พฤษภาคม 2569 ทาง Google ได้เปิดให้ใช้งานโมเดล Omni Flash แล้วสำหรับกลุ่มผู้สมัครสมาชิก Google AI Plus, Pro และ Ultra ผ่านแอปพลิเคชัน Gemini และแพลตฟอร์ม Google Flow พร้อมทั้งมีแผนขยายให้ใช้งานได้ฟรีบน YouTube Shorts และแอปพลิเคชัน YouTube Create

วิธีใช้ Gemini Omni ทีละขั้นตอน

ช่องทางที่ 1 ผ่าน Gemini App (แนะนำสำหรับผู้เริ่มต้น)

การใช้งานผ่านแอปพลิเคชันถูกออกแบบมาให้ตรงไปตรงมาและเป็นมิตรกับผู้ใช้งาน โดยมีขั้นตอนดังนี้:

เข้าสู่ระบบ : เปิดแอปพลิเคชัน Gemini (รองรับทั้ง Android และ iOS) หรือเข้าไปที่เว็บไซต์ gemini.google.com
ยืนยันสิทธิ์ : ล็อกอินด้วยบัญชี Google ที่มีการสมัครสมาชิกแพ็กเกจ AI Plus, AI Pro หรือ AI Ultra
เริ่มต้นใช้งาน : เลือกฟีเจอร์สำหรับการสร้างหรือแก้ไขวิดีโอ (อินเทอร์เฟซรูปแบบใหม่ได้รับการออกแบบภายใต้แนวคิด Neural Expressive Design)
นำเข้าข้อมูล : อัปโหลดข้อมูลตั้งต้น (Input) ซึ่งสามารถผสมผสานได้ทั้งรูปภาพ วิดีโอ และข้อความ
ป้อนคำสั่ง : พิมพ์รายละเอียดความต้องการอย่างชัดเจน เช่น "เปลี่ยนฉากหลังเป็นทะเลยามพระอาทิตย์ตก"
ปรับแต่งต่อเนื่อง : ตรวจสอบผลลัพธ์ หากต้องการแก้ไขเพิ่มเติม สามารถพิมพ์คำสั่งต่อเนื่องในรูปแบบบทสนทนา (Conversational Editing) โดยไม่ต้องเริ่มใหม่
บันทึกผลงาน : ทำการส่งออก (Export) และดาวน์โหลดไฟล์วิดีโอที่เสร็จสมบูรณ์

ช่องทางที่ 2 ผ่าน Google Flow (สำหรับสายงานโปรดักชัน)

Google Flow ทำหน้าที่เป็น AI Creative Studio ที่ออกแบบมาเพื่อรองรับกระบวนการทำงานของนักสร้างสรรค์เนื้อหาและคนทำภาพยนตร์อย่างเต็มรูปแบบ

แพลตฟอร์มนี้ควบรวมประสิทธิภาพของ Gemini Omni และ Lyria 3 Pro (โมเดล AI สำหรับดนตรี) ไว้ในที่เดียว
เพิ่มความยืดหยุ่นด้วยแอปพลิเคชันบนสมาร์ทโฟน ช่วยให้ทำงานได้ทุกที่ทุกเวลา
ฟีเจอร์เด่นครอบคลุมตั้งแต่การตัดต่อวิดีโอ การเปลี่ยนมุมกล้อง การคุมโทนสี และสไตล์ภาพ ไปจนถึงการสร้างเสียงประกอบ(แต่ภาษาพูดจะเพี้ยนๆขาดอารมณ์ร่วมไม่ว่าจะภาษาอังกฤษหรือภาษาไทย)
สามารถใช้เริ่มใช้ Gemini Omni ผ่าน Google Flow ได้ที่ลิ้งก์นี้

ช่องทางที่ 3 ผ่าน YouTube Shorts และ YouTube Create (ไม่มีค่าใช้จ่าย)

สามารถเข้าถึงเครื่องมือได้โดยตรงผ่านแอปพลิเคชัน YouTube Create หรือส่วนตัดต่อวิดีโอของ YouTube Shorts
เป็นช่องทางที่เหมาะสมสำหรับครีเอเตอร์ที่ต้องการทดสอบประสิทธิภาพของเครื่องมือ AI ก่อนตัดสินใจลงทุนในแพ็กเกจระดับพรีเมียม(แต่โทเค่นหมดไว)

ราคา และ แพ็กเกจ สำหรับการใช้งาน Gemini Omni

จากการอัปเดตข้อมูลโครงสร้างราคาสำหรับผู้ใช้งาน การเข้าถึง Gemini Omni มีตัวเลือกที่ครอบคลุมตั้งแต่ผู้เริ่มต้นไปจนถึงระดับองค์กร ดังนี้:

แพ็กเกจฟรี (Free Tier): ผู้ใช้งานสามารถเข้าถึงระบบได้โดยไม่มีค่าใช้จ่ายผ่านแอปพลิเคชัน YouTube Shorts และ YouTube Create เหมาะสำหรับการใช้งานพื้นฐาน โดยฟีเจอร์ขั้นสูงบางประการและโควตาการประมวลผลอาจถูกจำกัดเมื่อเทียบกับแผนแบบชำระเงิน
Google AI Plus: ค่าบริการประมาณ 189 บาทต่อเดือน เป็นแพ็กเกจที่คุ้มค่าสำหรับการเริ่มต้น โดยมอบสิทธิ์การเข้าถึงโมเดล Gemini Omni Flash ผ่านทาง Gemini App รูปแบบใหม่และแพลตฟอร์ม Google Flow
Google AI Pro และ AI Ultra: ออกแบบมาสำหรับผู้ที่ต้องการเข้าถึงฟีเจอร์ขั้นสูงและโมเดลรุ่นอัปเดตก่อนใคร โดย AI Pro มีค่าบริการอยู่ที่ 750 บาทต่อเดือน และรุ่นสูงสุดอย่าง AI Ultra อยู่ที่ 3,500 บาทต่อเดือน

*นี่เป็นราคาบนเว็บไซต์ One.Google ยังไม่รวมภาษี

Gemini Omni เหมาะกับใคร และใช้ทำอะไรได้บ้าง

ด้วยความสามารถระดับ Multimodal การประยุกต์ใช้โมเดลนี้จึงครอบคลุมหลากหลายอุตสาหกรรม

สำหรับ Content Creator และ YouTuber : เปลี่ยนกระบวนการตัดต่อที่ซับซ้อนให้ง่ายขึ้นด้วยการสั่งงานผ่านภาษาพูดตามธรรมชาติ ผู้ใช้ไม่จำเป็นต้องมีทักษะตัดต่อระดับสูง ก็สามารถปรับแต่งจังหวะภาพ หรือกระทั่งเปลี่ยนสไตล์ของวิดีโอจากภาพคนจริงให้กลายเป็นแอนิเมชัน หรือศิลปะยุคสุโขทัยได้ในคำสั่งเดียว
สำหรับนักการตลาด และเจ้าของธุรกิจ : เป็นเครื่องมือสำคัญในการสร้างวิดีโอแคมเปญโฆษณาสำหรับคลินิกความงามหรือแบรนด์ผลิตภัณฑ์ที่ต้องการนำเสนองานภาพสไตล์เรียบหรู รวมถึงการทำระบบ Virtual Try-On สำหรับธุรกิจอีคอมเมิร์ซ ซึ่งเทคโนโลยีนี้ช่วยลดต้นทุน ทั้งด้านพนักงานและระยะเวลาในกระบวนการโปรดักชันลงได้(จำเป็นต้องมีความสามารถในการตัดต่อเพื่อให้ได้ผลที่ดีที่สุดอยู่ดี)
สำหรับสายงานภาพยนตร์ และศิลปะ : สนับสนุนกระบวนการผลิตภาพยนตร์สั้น จากสคริปต์ตั้งต้น โดยไม่จำเป็นต้องพึ่งพาทีมงานกองถ่ายขนาดใหญ่ การทำงานร่วมกันระหว่าง Google Flow และ Gemini Omni สามารถรองรับเวิร์กโฟลว์ระดับมืออาชีพได้(การทำงานมืออาชีพจำเป็นต้องใช้ประสบการณ์อย่างมากอยู่ดีไม่ควรไว้วางใจ AI 100%)
สำหรับองค์กร และนักพัฒนา : บริษัทสามารถผสานขีดความสามารถของ Gemini Omni เข้ากับผลิตภัณฑ์หรือบริการของตนเองผ่านระบบ API ได้โดยตรง ตัวอย่างการใช้งานจริงในระดับองค์กร เช่น การสร้างแพลตฟอร์ม Virtual Try-on , การผลิตวิดีโอสำหรับฝึกอบรมพนักงาน หรือการสาธิตการใช้งานผลิตภัณฑ์ แบบอัตโนมัติ(แต่ไม่ควรให้ทำวิดีโอซับซ้อนควรเป็นวิดีโอสอนง่าย)

Tips และ Prompt ที่ใช้กับ Gemini Omni ให้ได้ผลดี

วิธีการเขียน Prompt ที่ดี

การสั่งงานโมเดล AI ให้ผลิตภาพเคลื่อนไหวที่มีคุณภาพและนำไปใช้งานได้จริง จำเป็นต้องมีโครงสร้างคำสั่ง (Prompt) ที่ละเอียด โดยควรระบุองค์ประกอบหลักให้ครบถ้วนภายในคำสั่งเดียว ได้แก่ ประธาน (Subject) กริยา (Action) ฉากหรือสถานที่ (Setting) สไตล์ของภาพ (Style) และมุมกล้อง (Camera Angle)

ตัวอย่าง Prompt ที่ดี :
"แพทย์หญิงกำลังให้คำปรึกษาคนไข้ในคลินิกตกแต่งสไตล์ Luxury Minimalist เน้นการคุมโทนสีขาว ครีม และทอง ถ่ายด้วยช็อตระยะกลาง (Medium Shot) จัดแสงนุ่มนวลและดูน่าเชื่อถือ" (การระบุโทนสีและสไตล์ชัดเจนช่วยให้ AI ล็อกท่าทางได้แม่นยำ ถ้าใช้การต่อสู้ ให้ระบุละเอียดไม่งั้นอาจได้การตบแปะแทน)
ตัวอย่าง Prompt ที่ควรหลีกเลี่ยง :
"ทำวิดีโอคลินิกสวยๆ" คำสั่งลักษณะนี้มีความหมายกว้างเกินไป ขาดทิศทาง ทำให้โมเดลต้องคาดเดาองค์ประกอบเองและมักได้ผลลัพธ์ที่ไม่ตรงตามต้องการ(อย่าให้ AI คิดเอง ไม่งั้นวีดีโอจะไม่ถูกใจคุณแน่นอน ให้กำหนดให้ละเอียดที่สุด)

FAQ

Q1 : Gemini Omni ต่างจาก Gemini ทั่วไปอย่างไร?

Gemini เน้นประมวลผลข้อความและภาพนิ่ง ส่วน Gemini Omni สร้างวิดีโอ และแก้ไขจุดต่าง ๆ ผ่านคำสั่งได้ต่อเนื่องในระบบเดียว

Q2 : ใช้ Gemini Omni ฟรีได้ที่ไหน?

ใช้งานฟรีผ่านแอป YouTube Shorts และ YouTube Create (จำกัดความละเอียดและบางฟีเจอร์เทียบกับแพ็กเกจเสียเงิน)

Q3 : Gemini Omni รองรับภาษาไทยหรือเปล่า?

รองรับ Prompt ภาษาไทย สามารถสั่งการได้เลยเพราะว่าสามารถวิเคราะห์ในสิ่งที่เราพิมพ์ได้

Q4 : Gemini Omni Flash กับ Omni Pro ต่างกันอย่างไร?

Omni Flash เน้นความเร็ว ประหยัดทรัพยากร เหมาะกับงานทั่วไป ณวันที่ 20/5/69 ยังไม่มีเวอร์ชั่น Pro ออกมา