本文由第三方AI基于17173文章http://news.17173.com/content/04302026/160803153.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
英特尔携手 AMD 发布 ACE 架构提升 AI 性能,x86 矩阵计算密度提升 16 倍
2026-04-30 16:08:03
神评论
17173 新闻导语
英特尔与AMD联合发布ACE架构白皮书,x86矩阵计算密度提升16倍,大幅增强AI性能与能效,覆盖笔记本到超算全场景。
4 月 30 日消息,科技媒体 Wccftech 昨日(4 月 29 日)发布博文,报道称英特尔和 AMD 联合发布人工智能计算扩展(ACE)白皮书,将其定位为 x86 架构的标准矩阵加速方案。
现有 AVX10 等 SIMD 扩展虽能处理矩阵运算,但在计算密度与扩展性上存在局限,ACE 正是为突破这一瓶颈而生。
ACE 作为 x86 指令集的关键扩展,核心目标是大幅提升矩阵乘法性能、扩展性与能效。矩阵乘法作为神经网络与大语言模型的核心计算模块,其效率直接决定 AI 工作负载的表现。
技术层面,ACE 引入基于外积运算(outer product operation)的矩阵加速机制,无缝集成 AVX10。白皮书数据显示,在消耗相同数量输入向量的前提下,ACE 外积运算的计算密度比等效的 AVX10 乘加运算(multiply-accumulate operation)高出 16 倍。

ACE 在底层计算方面,支持 INT8、OCP FP8、BF16 等主流 AI 数据格式,其设计兼顾灵活性与扩展性,旨在构建覆盖笔记本电脑到超级计算机的全场景矩阵加速框架。

在软件生态方面,ACE 集成低精度 GEMM 等深度学习和高性能计算库,并启动适配 NumPy、SciPy 等 Python 库以及 PyTorch、TensorFlow 等主流机器学习框架。
附上参考地址
The AI Compute Extensions (ACE) for x86
【来源:IT之家】
热门测试游戏

