17173 > 游戏资讯 > 科技新闻 > 正文

中国AI新突破!马斯克点赞Kimi新架构 Kimi幽默回应:你的火箭也不错

2026-03-17 13:00:35 神评论
17173 新闻导语

中国AI新突破!马斯克点赞Kimi新架构,采用Attention Residuals机制,颠覆传统残差连接,训练效率提升1.25倍,科学推理成绩提升7.5%。深度学习2.0时代来临,点击了解详情!

据报道,在特斯拉CEO埃隆·马斯克公开点赞中国AI公司Kimi的最新研究成果后,Kimi官方账号今日以幽默口吻回应:“你的火箭造得也不错!”

近日,Kimi团队发布技术报告,提出全新Attention Residuals(注意力残差)机制,对深度学习领域沿用近十年的传统残差连接实现颠覆性重构,迅速获得全球关注。

传统残差连接以“固定等权累加”传递信息,层数增加易导致浅层信息稀释、训练效率低、稳定性差。

而Kimi的创新相当于给AI装了“智能筛选器”,将Transformer注意力机制迁移到模型深度维度,让每一层动态筛选此前有用信息、压低冗余,提升传递效率。

为避免内存过载,团队设计“块注意力残差”策略,模型分块后,块内保留传统累加保证稳定,块间采用动态加权,推理延迟仅增加不到2%,实现性能与效率平衡。

实测显示,48B参数模型训练效率提升1.25倍,科学推理、数学题作答成绩分别提升7.5%、3.6%,有效解决传统模型训练失衡问题。

以挑剔著称的马斯克转发研究并评论“Kimi的作品令人印象深刻”,其旗下xAI正处重组期,此次认可足见技术分量。

此外,被誉为“推理模型之父”的前OpenAI研究副总裁Jerry Tworek也发文表示:“深度学习2.0来了”

【来源:快科技】
关于Kimi,AI,Attention Residuals,Transformer,深度学习,马斯克,残差连接,模型训练,推理效率,48B参数的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷