Google Ra Mắt Gemini Omni—Trình Tạo Video AI Thế Hệ Mới Có Thể 'Mô Phỏng Thế Giới'

###Tóm tắt ngắn gọn

* Google giới thiệu Gemini Omni tại I/O 2026 như một mô hình AI đa phương thức được thiết kế để tạo video và các phương tiện truyền thông khác từ gần như bất kỳ đầu vào nào.
* Giám đốc điều hành DeepMind Demis Hassabis cho biết Gemini Omni kết hợp Gemini với các mô hình tạo media bao gồm Veo, Nano Banana và Genie.
* Gemini Omni Flash sẽ ra mắt đầu tiên qua Flow và Flow Music dành cho người đăng ký Google AI.

Google vào thứ Ba đã giới thiệu Gemini Omni, một mô hình AI đa phương thức mới kết hợp các mô hình Gemini của công ty với các công cụ tạo media, bao gồm Veo, Nano Banana và Genie.
Thông báo này được đưa ra trong Google I/O 2026, nơi Giám đốc điều hành DeepMind Demis Hassabis mô tả Gemini Omni là “mô hình mới của chúng tôi có thể tạo mọi thứ từ bất kỳ đầu vào nào.”
“Nó kết hợp trí tuệ của Gemini với những mô hình media sáng tạo tốt nhất của chúng tôi để nâng cao khả năng hiểu thế giới, đa phương thức và chỉnh sửa,” Hassabis nói.

Google cho biết phiên bản đầu tiên, Gemini Omni Flash, sẽ ra mắt qua Flow, nền tảng làm phim AI của công ty, và Flow Music, tập trung vào sáng tạo âm nhạc hỗ trợ AI.

> Chúng tôi đang ra mắt Gemini Omni: bước đầu tiên hướng tới một mô hình có thể tạo mọi thứ từ mọi thứ - bắt đầu với video.
>
> Nó kết hợp trí tuệ của Gemini với các hệ thống media sáng tạo của chúng tôi - đánh dấu bước tiến lớn trong hiểu biết thế giới, đa phương thức và chỉnh sửa 🧵 pic.twitter.com/GAtqzr0VIV
>
> — Google DeepMind (@GoogleDeepMind) 19 tháng 5, 2026

Gọi Omni là “bước tiến hướng tới trí tuệ nhân tạo tổng quát,” Hassabis nói Google đã dành cả năm để mở rộng Gemini thành “một mô hình AI hiểu và mô phỏng thế giới.”
Việc ra mắt Omni của Google dựa trên sự phổ biến của Nano Banana, mô hình chỉnh sửa hình ảnh AI trước đó của công ty giúp đẩy Gemini lên vị trí hàng đầu trong App Store của Apple vào tháng 9 năm ngoái. Nano Banana trở nên phổ biến trong việc tạo meme và chỉnh sửa hình ảnh đối thoại, tạm thời giúp Gemini vượt qua ChatGPT về lượt tải ứng dụng và sự quan tâm tìm kiếm trên Google lần đầu tiên kể từ khi chatbot của OpenAI ra mắt vào năm 2022.

Trong so sánh của Decrypt đầu tháng này, Nano Banana 2 vượt trội hơn GPT Image 2 của OpenAI trong các bài kiểm tra minh họa anime và bố cục không gian, trong khi mô hình của OpenAI hoạt động tốt hơn về khả năng chân thực và hiển thị văn bản. Google hiện có vẻ đang mở rộng nhiều tính năng chỉnh sửa đó vào video thông qua Gemini Omni.

Trong buổi trình diễn, Google đã thể hiện Omni tạo ra một video giáo dục theo phong cách claymation giải thích cách gấp protein. Công ty cũng trình diễn các công cụ chỉnh sửa đối thoại giúp thay đổi một video selfie bằng cách thêm các yếu tố hình ảnh mới và thay đổi môi trường xung quanh.
Google nói rằng Omni có thể giữ cho các nhân vật, nền và chuyển động nhất quán ngay cả sau khi người dùng chỉnh sửa video — điều mà nhiều mô hình AI tạo video gặp khó khăn. Công ty cũng cho biết Omni sử dụng khả năng lý luận của Gemini để hiểu các hướng dẫn rộng hơn, giúp người dùng mô tả loại cảnh họ muốn mà không cần giải thích thủ công từng chi tiết.
Công ty cũng giới thiệu Flow Agent, một trợ lý AI tích hợp vào Google Flow có thể lên ý tưởng các cảnh, tổ chức tài nguyên, đề xuất thay đổi cốt truyện và chỉnh sửa hàng loạt các dự án.
Các cập nhật bổ sung bao gồm Flow Tools, cho phép người dùng tạo quy trình chỉnh sửa tùy chỉnh bằng các lệnh ngôn ngữ tự nhiên mà không cần kinh nghiệm lập trình.
Hassabis nói Google bắt đầu với tạo video, nhưng có kế hoạch mở rộng quyền truy cập vào Omni, mô tả đây là tầm nhìn dài hạn đằng sau thiết kế đa phương thức của Gemini.
“Đây luôn là mục tiêu của chúng tôi với Gemini, và lý do chúng tôi xây dựng nó để trở thành đa phương thức ngay từ đầu,” ông nói.

Google không phản hồi ngay lập tức yêu cầu bình luận của Decrypt.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim