本文由第三方AI基于17173文章http://news.17173.com/content/07012026/020732941.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
单芯片混合精度浮点算力达 896TFLOPS,中昊芯英新一代 TPU 芯片「须臾」发布
2026-07-01 02:07:32
神评论
17173 新闻导语
中昊芯英发布新一代全自研TPU芯片“须臾”,单芯片混合精度浮点算力达896TFLOPS,性能提升3倍,功耗降低50%,无海外依赖,适配主流AI框架,助力智算底座泰则2.0同步亮相。
6 月 30 日消息,中昊芯英今天宣布推出新一代全自研高性能 TPU AI 专用芯片「须臾」,软硬件一体化智算底座「泰则 2.0」也在今天同步亮相。

据介绍,须臾的单芯片混合精度浮点算力可达 896 TFLOPS,性能是上一代芯片「刹那」的 3 倍;8-bit 推理算力可达 1792TOPS,适配海量词元高并发推理场景。须臾的显存、芯片内部互联速率均有大幅提升,支持超长上下文。单卡额定功耗 600W,相比传统算力芯片功耗降低 50%,助力低碳数据中心建设。
同时,须臾的芯片 IP 核、专属指令集、底层算子加速库、整机系统软件均是完整自主研发,无海外核心技术依赖。满足政务、金融、电网等行业的安全合规要求。
而「泰则 2.0」则是高性能智算平台中标准的最小计算单元,它搭载两路高性能 CPU 处理器与 8 片高性能 TPU 处理单元,从物理形态上形成 1 台通用的 CPU 服务器外接 1 台高性能 TPU 算力加速设备,算力达 7.168P(注:混合精度),同等任务下整机能耗仅为传统 GPU 服务器的 80%。
此外,该平台从软件层面实现了全主流 AI 框架兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具,训练场景适配 DeepSpeed、Megatron-LM 分布式套件;已完成 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言、多模态模型深度适配,开发者可快速完成模型迁移。
【来源:IT之家】
热门测试游戏
- 1终于有新端游MMO了!NEXON出品,尺度大的不可思议
- 2624人、10个亿,快手在西幻MMO里搞了一场诡秘豪赌
- 36月热游情报:米哈游公布全新AI情感伴侣,《GTA6》预售引发全球抢购
- 4《逆水寒》八周年资料片“月刃破晓”即将上线 全新团本“关山止戈·边塞”7月9日登场
- 5《御龙在天》6月30日全服更新:龙渊战场正式开启,全新职业“索命”同步上线
- 6等等党没希望了!多家公司警告内存价格飙升至少持续至2028年
- 7《燕云十六声》要跑路了?官方发文暗示要7月“撤离”!
- 8全新阵营玩法「烽行险道」首曝!《诛仙世界》S4赛季「碧落凡心」7月8日开启
- 9国产游戏《异环》新时装身材缩水,老外质疑被和谐引发论战
- 10《洛奇英雄传》暑期福利开启,三大活动开放,时装强化石免费领取

