17173 > 游戏资讯 > 科技新闻 > 正文

谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 AI 修改视频

2026-05-20 02:03:09 神评论
17173 新闻导语

谷歌发布全能AI模型Gemini Omni!支持文字、图像、视频、音频多模态处理,一句话即可修改视频内容,体验前所未有的AI交互。立即了解详情!

感谢网友 软媒用户1053564、HH_KK 的线索投递!

5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌正式发布了 Gemini Omni 模型。

诺贝尔物理学奖获得者、Google DeepMind 负责人哈萨比斯(Demis Hassabis)表示,Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的版本。“Omni”意指“全能”,该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。

Gemini Omni 宣称能“从任何输入生成任何输出”,支持对话式编辑,用户可一句话改变视频中的角色、背景等元素。

从大会获悉,谷歌还宣布推出 Gemini Omni 家族首款模型 Gemini Omni Flash,即日起可在 Gemini App、Google Flow、YouTube Shorts 可用,未来将推 API 服务。

2026 谷歌 I/O 开发者大会专题

【来源:IT之家】
关于Gemini Omni,谷歌 I/O 开发者大会,Google DeepMind,多模态模型,视频编辑,Gemini Omni Flash,AI模型,输入输出,对话式编辑,YouTube Shorts的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷