新游热游: 全球国内手游盘点测试表开服表怀旧频道

品牌: 游戏X博士正惊游戏公众号

新闻大全

17173 > 游戏资讯 > 科技新闻 > 正文

150 tokens/s！NVIDIA为谷歌DiffusionGemma提供首日支持：RTX/DGX全系可用

2026-06-11 12:04:00 神评论

17173 新闻导语

NVIDIA全面支持谷歌DiffusionGemma！RTX/DGX系列可用，150 tokens/s速度，免费开源，无需联网，本地部署更安全。点击了解详情！

NVIDIA宣布为谷歌DeepMind最新发布的开放模型DiffusionGemma提供首日支持，覆盖GeForce RTX GPU、RTX PRO平台和DGX系统全系列。

DiffusionGemma基于Gemma 4架构，总参数25.2亿，推理时仅激活3.8亿参数，支持256K上下文长度，并针对NVIDIA硬件深度优化。。

与传统自回归模型逐个生成token不同，它采用文本扩散架构，每步可并行去噪256个tokens，在NVIDIA GPU上速度提升约4倍。

性能方面，NVIDIA通过Tensor Core架构和CUDA软件栈实现了无需额外调优即可获得优异性能。单块H100 GPU可达每秒1000 token，在DGX Spark上达150 tokens/s。

该模型支持BF16/NVFP4精度格式，开发者可通过Hugging Face Transformers在RTX 5090或DGX Spark上快速原型验证，生产环境可使用vLLM进行部署。

该模型采用Apache 2.0许可证开源，支持文本与图像多模态输入，支持完全运行于本地RTX或DGX平台，无需联网、无需按token付费。

目前已在Hugging Face Transformers、vLLM、Unsloth等框架中获得初始支持。

对于Windows开发者，RTX 5090用户可立即下载体验；专业级用户则可选用RTX PRO 6000工作站或DGX Station完成大规模部署和微调任务。

【来源：快科技】

关于NVIDIA,DiffusionGemma,GPU,RTX,DGX,Gemma,文本扩散,Tensor Core,CUDA,vLLM的新闻

今日热点

DNF之后最强动作网游，3天70万在线，玩家却被“斩杀”？

《古剑》7月18日线下试玩《终末地》云游戏不限量测试

韩国人做了一款满是大雷和断肢的“暗黑四”

《魔兽世界》12.1奖励全解析《暗黑4》S14赛季7月1日上线

热门测试游戏

热门新闻排行

Wan网页游戏免费玩