
商傳媒|葉安庭/綜合外電報導谷歌(Google)於年度開發者大會 Google I/O 2026 上,發表全新人工智慧(AI)世界模型 Gemini Omni。這款模型被谷歌描述為「能從任何輸入產生任何內容」的突破性技術,並具備多模態輸入與輸出能力,可處理文字、音訊、圖片及影片等多元格式。
Gemini Omni 模型家族的首款應用為 Gemini Omni Flash,今日已開始向訂閱 Google AI Plus、Pro 及 Ultra 的用戶開放,可透過 Gemini 應用程式和 Google Flow 使用。本週稍晚,Gemini Omni Flash 也將免費導入 YouTube Shorts 和 YouTube Create 應用程式,讓更多用戶得以體驗。
谷歌指出,Gemini Omni 能產生具備更精準物理表現的影片,創造更寫實的內容。同時,它也能理解提示中的情境,例如歷史事實,以生成更為準確的影片。用戶不僅能透過對話方式編輯影片,還能調整影片的風格、角度、場景,甚至剪輯片段中的特定細節。
此外,Gemini Omni Flash 也將支援透過虛擬替身(Avatars)製作數位分身功能,不過谷歌目前仍在負責任地測試這項功能。為了確保內容的真實性與可追溯性,所有透過 Omni 生成的影片都將嵌入 SynthID 浮水印。
谷歌 DeepMind 執行長兼共同創辦人德米斯·哈薩比斯(Demis Hassabis)形容 Gemini Omni 是邁向通用人工智慧(AGI)的關鍵一步,彰顯其在 AI 領域的雄心。


