本文由第三方AI基于17173文章http://news.17173.com/content/02052026/012858908.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
2026-02-05 01:28:58
神评论
17173 新闻导语
腾讯首席科学家姚顺雨首篇论文《CL-bench》揭示AI为何听不懂人话:顶级语言模型上下文学习能力仅17.2%,指出AI与真正智能的核心差距在于动态学习能力!
快科技2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。
值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。
他在文中提到,当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。
一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。

人类并不只依赖多年前学到的死知识,而是在实时地从眼前的上下文中学习。
在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。
为了衡量现有模型距离真正的“上下文学习者”还有多远,研究团队构建了CL-bench。
这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。
CL-bench包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。
CL-bench只包含一个简单但苛刻的要求:“解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。”
通过实验发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2%。
也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。
不过这也为大语言模型后续的迭代指出了一个可能的方向,强化模型从上下文中进行学习的能力。
【来源:互联网】
今日热点
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 一看吓一跳:雷死人不偿命的囧图集(1033)
- 一看吓一跳:雷死人不偿命的囧图集(1031)
- 一看吓一跳:雷死人不偿命的囧图集(1034)
- 正惊GIF:人神共愤!如此漂亮女教师被气到动手,学生竟一脸无所谓
- 颜值COS,玉足、白丝过膝袜,体操服双马尾,简直太迷人
- 一看吓一跳:雷死人不偿命的囧图集(1035)
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 2月多款重磅新游测试:腾讯网易完美新作齐发、经典韩国MMO新作
- 《蔚蓝档案》「白丝透肤VS发光腹肌!砂狼白子体操服侧拍,腰线凹陷度堪比3D建模」
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 《燕云十六声》掌中宝+特殊蹊跷位置大全,三寸之身任务合集,仅剩7天10连抽连袅袅之音!
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 「纯欲天花板」2B花嫁撕破次元!白丝过膝陷肉感,透粉脚底VS发光蛮腰の双重暴击
- 《传奇5》真的要来了?还有《绝地求生》衍生作上线!盘点2026年能够玩到的韩国游戏
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 和平精英2025灵敏度分享码:最稳压枪灵敏度方案推荐
- AI大姐姐:胸猛美女,挑战你的视觉极限(221)
- 《魔兽世界》时光服:附魔1-450快速性价比冲级攻略

