本文由第三方AI基于17173文章http://news.17173.com/content/04102026/190104553.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时
2026-04-10 19:01:04
神评论
17173 新闻导语
GLM-5.1登顶开源AI模型第一!编程能力45.3分,8小时独立构建Linux桌面,SWE-bench Pro超越GPT-5.4。全球第三,开源最强!
3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。
前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了——全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。
除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:
·8小时从零构建Linux桌面
·655次迭代打破向量数据库优化瓶颈
·1000轮工具调用优化真实机器学习模型负载
值得一提的是,在METR榜单的同等评估标准下,GLM-5.1是唯一达到8小时级持续工作的开源模型,也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

此前智谱提到,GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。
在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成绩,超过GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug,是衡量模型能否胜任专业软件开发的最硬指标。

【来源:快科技】
热门测试游戏
- 13 分钟看懂!刚公测的《王者荣耀・世界》,到底值不值得玩?
- 2《热血传奇》上线25周年,东方幻想MMORPG鼻祖再发力
- 3砸十亿、喊 3A、对标原神,为什么大厂的开放世界全凉了?
- 4玩家质疑《影之刃零》抄袭外国!外网网友:见识少了
- 5《王者荣耀世界》超全超细的公测首发英雄一图流+养成系统详解
- 6上线四个月惨遭下架,玩家怒斥平台打压成人游戏
- 7全新竞技玩法,联动仙剑三!《剑网3》新版本定档4月23日
- 8魔兽故事:暴风城新王后定了?安度因带黑妹见“家长”,网友:毁灭吧这世界!
- 9回忆录:蹲网吧看别人玩传奇,一次拾金不昧,换来一张梦寐以求的点卡
- 103秒速配,还能双修?《逆水寒》首个情缘服4月17日开启


