17173 > 游戏资讯 > 科技新闻 > 正文

英伟达多模态“全能模型”登场 智能体效率领先对手9倍

2026-04-29 09:01:52 神评论
17173 新闻导语

英伟达发布全能模型Nemotron 3 Nano Omni,整合视频、音频、图像和文本推理,智能体效率领先对手9倍,六大权威榜单榜首,下载量超5000万次!

据媒体报道,英伟达在官网正式发布了开放式多模态模型“Nemotron 3 Nano Omni”。

英伟达表示,新模型将多种功能整合于一个系统之中,使智能体能够利用视频、音频、图像和文本的高级推理能力,提供更快、更智能的响应。

英伟达声称,Nemotron 3 Nano Omni以领先的准确性和较低的成本,为开放式多模态模型树立了新的效率标杆。在复杂文档智能解析、视频及音频理解等六大权威排行榜上,该模型均位居榜首。

据介绍,Nemotron 3 Nano Omni采用30B-A3B混合专家架构,将视觉与音频编码器集成于一体,无需额外的感知模型,从而显著提升了大规模推理效率。

它不仅效率高,而且拥有强大的多模态感知精度,使AI系统的吞吐量是其他具有相同交互性的开放式全向模型的9倍。

声明中提到,已有部分公司率先采用该模型。H Company首席执行官Gautier Cloix表示:“基于该模型,我们的智能体可以快速解读全高清屏幕录像——这在以前是无法实现的。”他补充道,“这不仅仅是速度上的提升,更是智能体实时感知并与数字环境交互方式的根本性转变。”

英伟达表示,在代理系统中,Nemotron 3 Nano Omni可与专有云模型、其他英伟达Nemotron开放模型以及第三方专有模型协同工作,为代理工作流程中的子代理提供支持。

声明最后还指出,Nemotron 3系列模型(包括Nano、Super和Ultra型号)在过去一年中的下载量已超过5000万次。

【来源:快科技】
关于英伟达,Nemotron 3 Nano Omni,多模态模型,智能体,效率,视频理解,音频理解,图像理解,文本推理,混合专家架构的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷