Google vừa giới thiệu Gemini Omni — mô hình AI video thế hệ mới có khả năng nhận video thực làm đầu vào và biến đổi thành cảnh quay hoàn toàn khác biệt. Điểm đáng chú ý nhất: người dùng không cần trả phí để trải nghiệm, chỉ cần mở YouTube Shorts và sử dụng tính năng Remix là đủ.
Gemini Omni khác gì so với Veo 3?
Trước đây, Google đã có Veo 3 và Veo 3.1 — hai mô hình tạo video từ văn bản hoặc âm thanh theo kiểu "tạo từ con số không". Gemini Omni đi theo hướng khác hoàn toàn: thay vì tạo mới, nó nhận video thực làm nguyên liệu rồi biến đổi thành một cảnh quay mang phong cách, bối cảnh hoặc nội dung hoàn toàn khác.
Phiên bản đầu tiên được triển khai là Gemini Omni Flash, định vị là mô hình video-to-video. Theo Android Authority, công nghệ này cho phép "bẻ cong thực tại" theo nghĩa đen — những gì máy quay ghi lại có thể được tái tạo thành một thế giới hoàn toàn khác thông qua AI.
Quy trình sử dụng khá trực quan: người dùng tải lên ảnh tham chiếu, âm thanh hoặc video, hoặc mô tả ý tưởng bằng văn bản. Sau đó, có thể tinh chỉnh kết quả liên tục bằng ngôn ngữ tự nhiên — giống như đang "trò chuyện" với AI để đưa video đến gần hơn với hình dung ban đầu.
Tính nhất quán nhân vật và vật lý thực tế — Google hứa hẹn gì?
Google nhấn mạnh hai điểm kỹ thuật nổi bật của Gemini Omni. Thứ nhất là tính nhất quán của nhân vật xuyên suốt nhiều khung hình — mô hình được thiết kế để giữ nguyên ngoại hình và đặc điểm nhân vật trong toàn bộ chuỗi video. Thứ hai là khả năng mô phỏng vật lý thực tế, bao gồm trọng lực, động năng và thủy động lực học.
Tuy nhiên, Android Authority lưu ý rằng những tuyên bố về vật lý này vẫn ở giai đoạn demo — cần xem kết quả thực tế mới có thể đánh giá chính xác. Đây là điều người dùng nên ghi nhớ trước khi kỳ vọng quá cao.
Ngoài ra, Gemini Omni còn hỗ trợ tính năng Avatars — cho phép tải lên hình ảnh của bản thân để tạo nhân vật kỹ thuật số có ngoại hình và giọng nói tương tự. Google đã công bố hai video demo với sự tham gia của comedian Adam Waheed và YouTuber Happy Kelli.
Ba cách dùng Gemini Omni — một trong số đó hoàn toàn miễn phí
Gemini Omni được triển khai qua nhiều kênh với mức độ truy cập khác nhau:
| Kênh | Điều kiện | Chi phí |
|---|---|---|
| YouTube Shorts (Remix) | Tài khoản YouTube thông thường | Miễn phí |
| YouTube Create | Tài khoản YouTube thông thường | Miễn phí |
| Ứng dụng Gemini | Google AI Plus / Pro / Ultra | Từ $7,99/tháng (khoảng 204.000 VND/tháng) |
| Google Flow | Google AI Plus / Pro / Ultra | Từ $7,99/tháng (khoảng 204.000 VND/tháng) |
Với người dùng muốn trải nghiệm trước khi quyết định chi tiền, con đường rõ ràng nhất là vào YouTube Shorts, chọn một video có sẵn và sử dụng tính năng Remix. Còn với những ai cần sản xuất nội dung chuyên nghiệp hơn, Gemini app và Flow là lựa chọn phù hợp với gói trả phí.
Đối với người dùng tại Việt Nam, đây là tin tốt: không cần đăng ký gói trả phí để bắt đầu khám phá Gemini Omni — chỉ cần tài khoản YouTube là đủ.
Giới hạn 10 giây, SynthID và những điều cần biết trước khi dùng
Gemini Omni Flash hiện có một số ràng buộc kỹ thuật quan trọng:
- Độ dài tối đa: 10 giây mỗi video (có âm thanh đi kèm). Google cho biết đây là quyết định triển khai nhằm phục vụ nhiều người dùng hơn, không phải giới hạn của mô hình.
- Watermark ẩn SynthID: Toàn bộ video do Omni tạo ra đều được gắn watermark vô hình SynthID. Có thể xác minh qua ứng dụng Gemini, Gemini trong Chrome hoặc Google Search.
- API doanh nghiệp: Dự kiến mở trong vài tuần tới.
- Omni Pro: Phiên bản hiệu năng cao hơn đang được phát triển, chưa có ngày ra mắt cụ thể.
- Chỉnh sửa giọng nói/âm thanh: Tạm thời chưa triển khai do lo ngại deepfake — Google cho biết sẽ chờ đến khi có thể cung cấp tính năng này một cách có trách nhiệm.
Đáng lưu ý, SynthID đã được áp dụng cho hơn 100 tỷ ảnh và video AI tính đến nay, với các đối tác gồm OpenAI, ElevenLabs và Kakao.
Quyền của creator khi video bị "Remix" bằng AI — câu hỏi còn bỏ ngỏ
Một vấn đề chưa được Google làm rõ: creator có thể từ chối cho phép AI remix nội dung của mình hay không? Khi bất kỳ video Shorts nào đều có thể trở thành "nguyên liệu" cho Gemini Omni, quyền kiểm soát của tác giả gốc là câu hỏi quan trọng — đặc biệt với các creator Việt Nam đang xây dựng kênh trên nền tảng này.
Android Authority xác nhận rằng tính đến thời điểm đưa tin, Google chưa công bố thông tin về cơ chế opt-out cho creator. Đây là điểm cần theo dõi trong các cập nhật tiếp theo từ Google.
Gemini Omni được công bố tại Google I/O 2026, cùng với Gemini 3.5 Flash và Gemini Spark agent. Tính năng Remix trên YouTube Shorts dựa trên nền tảng Reimagine — công cụ AI đã ra mắt công khai từ ngày 18/3/2026, cho phép tạo video 8 giây từ một khung hình bất kỳ của Shorts. Lưu ý: Reimagine hiện chỉ hỗ trợ prompt tiếng Anh và chưa khả dụng tại Khu vực Kinh tế Châu Âu (EEA), Anh và Thụy Sĩ — người dùng Việt Nam không bị ảnh hưởng bởi giới hạn địa lý này.
Nguồn
- Android Authority — Google's newest Gemini Omni model can turn real videos into surreal fever dreams
- TechCrunch — Google's Gemini Omni turns images, audio, and text into video — and that's just the start
- Technobezz — Google Launches Gemini Omni Flash Model That Generates Video with Synchronized Audio
