本文由第三方AI基于17173文章http://news.17173.com/content/04142026/100141498.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
国产芯片新突破!棣山科技晒自研2nm高端AI GPU:兼容英伟达CUDA
2026-04-14 10:01:41
神评论
17173 新闻导语
国产芯片突破!棣山科技2nm AI GPU亮相,兼容CUDA生态,算力高达400 TFLOPS,HBM4内存带宽3.2TB/s,能效提升40%。点击了解技术细节!
近日,上海棣山科技对外披露其2nm高端AI GPU芯片最新研发进展。
据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。
该款2nm AI GPU原型芯片采用FinFET/GAA混合制程与Chiplet异构集成架构,搭载公司自主研发的“棣山智核(DS- Core)”,核心晶体管数量达1700亿颗,采用2.5D CoWoS-L先进封装技术。
性能表现上,这款芯片FP32单精度算力可达50 TFLOPS,FP16半精度算力达100 TFLOPS,FP4低精度算力高达400 TFLOPS,可灵活适配不同精度需求的人工智能大模型训练、推理等高端算力场景;能效比较上一代产品提升40%,典型功耗控制在350W以内,每瓦算力可达142 GFLOPS。
同时,研发团队成功攻克高带宽内存(HBM)封装互联、超低延迟片间通信(<0.25ns/mm)、微流道高效热管理三大核心技术瓶颈,其中搭载的HBM4内存单颗容量达48GB,引脚速率超11Gb/s,内存带宽可达3.2TB/s,相较上一代HBM3E带宽提升约2.5倍,可满足大模型训练时海量数据的高速传输需求;微流道热管理技术可使芯片热失控风险降低68%,芯片工作温度稳定控制在85℃以下。
此外,该芯片支持NVLink 6兼容互连协议,单链路带宽达1.6TB/s,多芯片互联时可实现无瓶颈协同运算,进一步提升整体算力规模,同时兼容主流CUDA软件生态,可大幅降低下游客户技术迁移成本。

【来源:快科技】
热门测试游戏
- 1《诡秘之主》PV上线,展示BOSS对战,灰雾测试正式定档
- 2死神VS火影,《JUMP全明星乱斗》开服,九大顶流IP集结
- 3经营地府《百夜地府》首曝预告,收录经典神话,金箍棒彩蛋亮相
- 4《历史模拟器:崇祯》6月25日本体转为免费游玩,创意工坊同步开启测试
- 5《天堂2:盟约》开服十大焚诀排行榜,不注意可能血亏上千!
- 62026 ChinaJoy 全品类参展亮点汇总
- 7《怪兽幻想》首支预告片公开,国产“怪猎+动森”融合之作亮相
- 8《绝地求生》开发商MOBA新游,《Project ZETA》限时公测开启
- 9腾讯《三体》衍生剧官宣,原版主创全回归,填补原著三年剧情空白
- 10《闪之轨迹:北方战役》今日公测,Falcom监修,历代角色齐聚

