Google 的多模態創作模型 — Gemini 的推理能力與生成式媒體系統的結合。透過自然語言從文字、圖片、影片或音訊生成和編輯影片,每次編輯都基於上一次的結果。使用 Nano Banana Pro 免費體驗。
多模態輸入、對話式編輯、風格轉換、真實世界知識 — 集於一體
Gemini Omni 引入了一種全新的影片編輯方式。你不需要每次都從頭開始生成,而是可以透過一系列自然語言指令逐步優化影片。改變背景、調整動作、替換物體、轉換攝影機角度或添加視覺效果 — 同時保持影片其餘部分的穩定。這種對話式工作流意味着你可以一步步迭代接近你的願景,就像編輯文件一樣。
多輪編輯:先建立場景,然後改變攝影機角度,再添加氛圍效果 — 全程保持一致性
多輪編輯在連續修改中保持場景連貫性
先建立一個人在房間裡的場景,然後改變光照為黃金時刻,再添加窗戶上的雨滴 — 每次編輯基於上一次
連續環境變化展示對話式逐步優化
Gemini Omni 可以轉換任何輸入影片的視覺風格,同時保留底層的運動、結構和場景構圖。描述目標美學 — 金屬表面、手繪素描、毛氈布偶、全息投影、體素藝術 — 模型會在每一幀上連貫地應用轉換。原始的攝影機運動、角色動作和空間關係保持不變,創造出遠超簡單濾鏡的無縫風格轉換。
當人觸碰鏡子時,讓鏡子像液體一樣美麗地蕩漾,人的手臂變成反射鏡面材質
風格轉換在完全改變視覺美學的同時保留運動
當人觸碰鏡子時,整個環境變成3D體素藝術,呈現方塊幾何形狀
完整環境轉換為體素藝術,同時保留空間結構
與只接受文字或單張圖片的模型不同,Gemini Omni 可以同時處理多種輸入類型。提供文字作為方向指引、圖片作為視覺參考、影片作為運動引導、音訊作為語音或聲音同步。模型將所有輸入綜合為單一連貫的影片輸出。這使其適用於靈感來自多個來源的真實創作工作流 — 分鏡草圖、參考片段、語音錄製和文字描述都可以為最終結果做出貢獻。
添加與我觸碰每片蕨葉同步的豎琴聲。將葉片結構改為生物發光植物,周圍有螢火蟲飛舞
結合影片輸入、文字指令和音訊參考實現同步輸出
使用真實世界科學知識視覺化蛋白質摺疊過程,以黏土動畫風格呈現準確的分子行為
將真實世界知識應用於科學視覺化,結合創意風格
Gemini Omni FAQ
Gemini Omni是Google DeepMind在2026年Google I/O大會上發佈的多模態影片創作模型。與普通的文字生成影片工具不同,它支援多輪對話式編輯(每次編輯基於上一次結果)、多模態輸入(文字+圖片+影片+音訊同時輸入)以及真實世界知識驅動的內容生成。你可以在 Nano Banana Pro 上免費體驗。
“Nano Banana Pro 上的多輪編輯徹底改變了我的影片製作方式。我可以像導演一樣逐步調整場景,每一輪修改都不會丟失之前的連貫性——這是我用過最接近AI攝影師的工具。”
獨立導演
“Nano Banana Pro 上的多輪編輯徹底改變了我的影片製作方式。我可以像導演一樣逐步調整場景,每一輪修改都不會丟失之前的連貫性——這是我用過最接近AI攝影師的工具。”
獨立導演