NVIDIA DGX Spark支持4台集群组网!性能线性飙升
NVIDIA DGX Spark现支持4台集群组网,AI算力达4千万亿次/秒,性能线性飙升!支持7000亿参数大模型推理,适合金融、医疗等行业快速部署AI业务。
NVIDIA 宣布,DGX Spark迎来全新功能,现已支持最多4台设备集群组网,从而搭建紧凑型的“桌面数据中心”。
被大家昵称“小金盒”的DGX Spark单台具备1千万亿次每秒的AI算力,搭配128GB LPDDR5X统一内存,四台并行就具备4千万亿次的算力和512GB统一内存。

DGX Spark现已支持多种运行拓扑结构,都依托ConnectX-7网卡提供的低延迟RoCE通信,针对不同目标做了专门优化:
单节点:
适合低延迟、大上下文长度推理,可推理最高2000亿参数模型、微调最高1200亿参数模型,以及本地智能体类工作负载。
双节点:
均衡扩展,可更快完成微调、支持更大模型,可支撑最高4000亿参数模型的推理。
三节点(环形拓扑):
适合更大模型微调或小型训练任务。
四节点(搭配RoCE 200GbE交换机):
可作为本地推理服务器,完美支持最高7000亿参数的前沿大模型、通信密集型工作负载,以及本地AI工厂运营。

NVIDIA号称,DGX Spark多台并行,可以实现接近线性的性能扩展提升,而且不需要像传统机架式服务器部署那样的复杂配置。
比如Isaac Lab强化学习性能,单节点性能630FPS,双节点翻番至1241FPS,四节点再次翻番至2520FPS,而延迟基本不变。
再比如Nanochat微调的性能,单节点Token输出速度为每秒约1.84万,双节点翻番至3.59万,四节点再次翻番至7.46万。

同时,NVIDIA还推出了全新的NVIDIA NemoClaw开源技术栈,DGX Spark可提供全栈平台,支持在本地构建、运行长期自主运行的AI智能体,后续也能无缝扩展至AI工厂等数据中心基础设施。
此外,DGX Spark还即将迎来新的软件版本,可进一步提升编排与管理能力,加速从原型到生产的迭代。
目前,金融、医疗、能源、通信等众多行业机构均已部署DGX Spark。

可以说,DGX Spark的这次重磅升级,再次彰显了NVIDIA在AI硬件架构与技术生态的双重领先地位。
从单设备到集群部署,从本地开发到企业级落地,NVIDIA再次以遥遥领先的技术与前瞻性的布局,定义了桌面级AI基础设施的新标杆,巩固了在全球AI算力领域的绝对领先优势。
从双节点到四节点,企业用户未来能够更高效地利用DGX Spark的算力优势,实现AI业务的快速落地,推进AI智能体的广泛落地。

- 1《王者荣耀世界》公测最全最细保姆级攻略,快速升级避坑不走弯路
- 2MMORPG《尤弥尔传奇》上线Steam 新职业同步推出
- 3曾经腾讯最火游戏之一,几乎QQ用户每个人都玩,停服的真相竟是…
- 4《剑星2》公布在即?开发商直言:好游戏是靠”屁股“做出来的
- 5游戏开发者因为觉得B站UP主可爱,于是把她做进了游戏,职业是青楼女子
- 6PC MMORPG《救世之树》推出新职业“海军准将”
- 7丝滑还是劝退?《梦幻西游》实装60帧引玩家争议
- 8和大雷公主的涩涩复仇冒险之旅 《星的归还者》Steam商店上线
- 9《魔法门之英雄无敌:上古纪元》4月30日抢先体验 体验不一样的全新作品
- 10首杀工会全团震惊!《魔兽世界》团本时隔9年再现隐藏阶段!


