本文由第三方AI基于17173文章http://news.17173.com/content/09292025/231834117.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
火速!寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源
2025-09-29 23:18:34
神评论
17173 新闻导语
寒武纪Day 0适配DeepSeek-V3.2-Exp并开源!体验全新稀疏注意力机制,优化长文本效率,降低部署成本。立即点击了解详情!
今天,DeepSeek宣布正式发布DeepSeek-V3.2-Exp模型。
新版本在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。
就在同一天,寒武纪宣布已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。
开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。
寒武纪一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。
此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。
针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。
寒武纪表示,依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。
【来源:快科技】
热门测试游戏
- 1全新黑暗奇幻动作搜打撤游戏《雾影猎人》6月15日新品节免费试玩
- 2《卧龙2》正式公布:赤壁对决曹操,2027年初发售
- 3《流放之路2》高价值暗金排名,国服新赛季必备
- 4时光服插件收费引发热议!魔兽国服的付费内容越来越离谱了
- 56月搬砖党必看!真正值得搬砖党关注的,这两款新游千万别错过
- 6《山海经》题材ARPG《定海》曝光宣传片 东方奇幻+双武器玩法
- 7腾讯入股后,《古剑》终于到了必须证明自己的时候
- 8TVB大尺度节目 女星互爆怪癖!每天穿情趣内衣都行
- 9燕云十六声:10套全新外观确定!端午节活动预告!白飘仙和鸣+黑白无常聆音卡池上线
- 10俄博主批评《剑星:血雨》性化未成年人 被网友扒出是个双标


