17173 > 游戏资讯 > 科技新闻 > 正文

从端侧到云端统一加速:英伟达、微软展示 AI 智能体完整部署栈,Fairwater 工厂提前上线

2026-06-03 04:00:31 神评论
17173 新闻导语

英伟达与微软Build 2026展示AI智能体完整部署栈,从RTX Spark到Azure云端统一加速,Fairwater工厂提前上线,打造端到端AI计算新标杆。

感谢网友 HH_KK 的线索投递!

6 月 3 日消息,在今日开幕的 Build 2026 开发者大会上,身处台北的英伟达 CEO 黄仁勋以线上连线的形式出席,并参与了微软 CEO 萨提亚 · 纳德拉的主题演讲。

双方围绕 RTX Spark、DGX Station for Windows、Foundry 平台上的 NVIDIA 开放模型、GitHub Copilot 中的 OpenShell 安全运行时以及下一代 AI 工厂等多项合作展开讨论。

微软、英伟达还宣布达成一系列深度合作,并在 Build 大会上展示了横跨 Windows 设备、Azure 云与本地部署的统一加速计算栈,为开发者构建、运行和扩展 AI 智能体与物理 AI 提供端到端支撑。

在 Windows 设备端,英伟达与微软将重新定义面向 AI 智能体时代的 PC。RTX Spark 是首批专为个人智能体打造的 Windows PC 平台,提供 1 petaflop 的 AI 算力、最高 128GB 统一内存、一整天的续航时间,以及无衰减的离电 AI 与图形性能。

该平台集成 CUDA、RTX、DLSS 和 TensorRT 等 NVIDIA 三十余年技术积累,搭载 RTX Spark 的笔记本和小型台式机将于今秋由微软 Surface、华硕、戴尔、惠普、联想和微星等厂商推出。

据介绍,DGX Station for Windows 则是目前性能最强的桌面级 AI 超级计算机,搭载 NVIDIA GB300 Grace Blackwell Ultra 桌面超级芯片,配备最高 748GB 统一内存和 20 petaflops FP4 性能,可在本地运行最高 1 万亿参数的先进模型。该系统预计于第四季度由华硕、戴尔、技嘉、惠普、微星和超微等厂商推出。两款产品均运行 NVIDIA OpenShell—— 一个面向自主智能体的安全设计运行时。

在模型与平台层面,NVIDIA 的开放模型组合已正式登陆微软 Foundry。Nemotron 3 Ultra 作为一款面向编码、科研和企业工作流中长期运行智能体的新型开放前沿推理模型,将于本月在 Foundry 托管计算上可用,同时上线的还有用于语音识别的 Nemotron 3.5 ASR 和 Nemotron 3.5 内容安全模型。

另外,Anthropic 的 Claude 模型现已在 Azure 上的 NVIDIA GB300 Blackwell Ultra 系统中原生运行,未来数周内向客户开放。

NVIDIA Agent Toolkit 和 NVIDIA NemoClaw 蓝图则为开发者提供了在 Foundry 上打造生产级智能体的开源平台,CUDA-X 库(包括 cuDF、cuOpt、AI-Q 和 NeMo)现已作为领域专用技能对智能体可用。

数据层方面,NVIDIA 加速计算现已内置到微软 Fabric Data Warehouse 中。微软内部基准测试显示,SQL 执行速度达到 CPU 基线的最高 6 倍,在高并发负载下相比其他三家主流云数据仓库提供商最高可达 7 倍。两家公司表示,这是从研究到生产的多年深度工程协作成果,使企业数据层能够跟上 AI 智能体持续查询与推理的速度。

在物理 AI 领域,微软正在将 NVIDIA 的开源物理 AI 技能和工具与 Azure 及物理 AI 工具链进行整合,为开发者提供基于 Cosmos 3 混合 Transformer 架构的统一平台,用于仿真、训练和部署机器人、自动驾驶车辆及工业系统等自主系统。Cosmos 3 在视觉推理、世界生成和动作生成等关键基准测试中位列开放模型第一位。针对本地部署场景,微软将 Azure Local 上的 Foundry Local 引入 NVIDIA RTX PRO 6000 Blackwell Server Edition 平台,配合 Nemotron 开放模型家族,企业可在本地、混合或主权环境中运行高性能 AI 负载。Foundry Local on Azure Local 现支持多节点部署和 vLLM 运行时。

在安全开发方面,NVIDIA OpenShell 已集成至 GitHub Copilot。每个智能体在其独立的沙箱容器中运行,每一次对外调用在触及文件、网络或凭证之前都会根据策略进行评估,策略以代码形式编写并在仓库中版本化管理,可即时更新。OpenShell 基于 Apache 2.0 开源协议,与模型无关,覆盖本地、混合和云环境。

AI 基础设施方面,微软位于威斯康星州费尔沃特的 AI 工厂已提前上线,运行数十万套 NVIDIA Grace Blackwell 系统,并与佐治亚州的一座同类 AI 工厂互联,构成可扩展的分布式 AI 系统。黄仁勋还亲口承认:微软部署了最多的 Blackwell 芯片。

微软已对 NVIDIA Vera Rubin 平台完成验证,该平台现已全面投产,将部署至 Azure 数据中心。Vera Rubin 无需改造即可与 Blackwell 并行部署,每兆瓦推理吞吐量提升最高 10 倍,每个智能体 token 成本降低一个数量级,并内置 NVIDIA 机密计算以保护模型和数据安全。

参考资料:

《Scaling multi-node LLM inference with NVIDIA Dynamo-Grove on AKS (Part 4) | AKS Engineering Blog》

微软 Build 2026 开发者大会专题

【来源:IT之家】
关于NVIDIA,微软,AI智能体,RTX Spark,DGX Station,Blackwell,Windows,Azure,AI工厂,OpenShell的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷