新游热游: 全球国内手游盘点测试表开服表怀旧频道

品牌: 游戏X博士正惊游戏公众号

新闻大全

17173 > 游戏资讯 > 科技新闻 > 正文

富士通介绍 PHOTON 框架：1.2B 模型多查询性能 475 倍于 Transformer

2026-06-25 20:08:13 神评论

17173 新闻导语

富士通PHOTON架构1.2B模型多查询性能比Transformer高475倍，大幅降低GPU成本，提升AI处理效率！

6 月 25 日消息，富士通 (Fujitsu) 日本当地时间昨日介绍了其开发的 PHOTON（自上而下网络并行分层计算）架构，宣称其在多查询（生成多个备选结果并在此基础上给出最终答案）场景下性能至高可达主流 Transformer 架构的 475 倍。

富士通表示，Transformer 架构的一大弊病是其在长上下文输入或多线程同步处理的场景下会执行大量访存操作来保留历史信息，这往往会导致处理速度下降。PHOTON 能高效率低开销地处理智能体系统等多 I/O 流程，从而降低 GPU 成本。

▲ 左：语义分层；右：并行计算

PHOTON 架构在语义层面上进行分层处理，相较 Transformer 的词元级分割可降低计算复杂度并提供了更好的并行性。而在多查询最后的决策环节，PHOTON 则采用了多数决定或选择最佳的方式，仅需一次推理。

测试结果表明，PHOTON 在 600M、900M、1.2B 等参数规模相对较小的模型中可实现更高的迭代吞吐量和更低的内存占用，其中 1.2B 模型上实现了 475 倍性能和略低的质量。此外，由于 PHOTON 架构每次迭代所需的 KV Cache 更少，还能提升最大迭代次数。

【来源：IT之家】

关于PHOTON,架构,Transformer,多查询,性能,GPU,模型,迭代,富士通,计算的新闻

今日热点

DNF之后最强动作网游，3天70万在线，玩家却被“斩杀”？

《古剑》7月18日线下试玩《终末地》云游戏不限量测试

最有武侠味的《九阴真经》，现在为什么没人玩了？

《魔兽世界》12.1奖励全解析《暗黑4》S14赛季7月1日上线

热门测试游戏

热门新闻排行

Wan网页游戏免费玩