17173 > 游戏资讯 > 科技新闻 > 正文

走路洗车、红绿色盲等问题都答不对了 网友吐槽最强编程AI降智严重

2026-04-11 15:01:43 神评论
17173 新闻导语

Claude Opus 4.6降智严重?走路洗车、红绿色盲逻辑题答错,开发者吐槽最强编程AI智商下降,AMD高管证实影响开发。点击了解详情!

虽然Anthropic前几天发布的Mythos刷新了最强AI大模型记录,但并没有开放使用,当前最强的AI编程大模型还是Claude Opus 4.6,也是目前最贵的。

然而近期Claude的降智问题已经引发了大批高价付费的开发者不满,之前连AMD的AI部门高管都出来表示降智问题已经影响了开发,而且影响范围挺大。

在国内的Linux.do社区中,也有多位网友谈到了Opus 4.6降智的问题,还用两个很出名的AI大模型测试问题做了验证。

这两个题一个是50米距离去洗车到底是要开车还是走路过去,一个是父亲因女儿红绿色盲而崩溃的,本质上都是逻辑陷阱,但很能考验AI的能力。

之前大把国内外AI在洗车问题上翻车,Claude的大模型是少有的能回答对的大模型之一,智商优势明显。

然而现在的实测下来,哪怕是最强大的Opus 4.6大模型,在这两个问题上也开始回答不对了,没有了之前的高智商能力。

也有网友贴图自己的测试,表示能答对,因此这个问题也不是完全一边倒的。

结合之前AMD的吐槽来看,近期Cluade的降智显然是存在的,只是降智的原因不好说,Anthropic公司的高管之前是不承认存在问题的。

比较合理的猜测还是跟算力有关,前几天马斯克的问题中无意中泄露了Claude的Sonnet 4.6是1万亿参数量的大模型,Opus 4.6则是5万亿参数量的,而且还不是MoE类型的,稠密模型对算力的要求很高,成本高昂,所以收费价格也是最贵的。

现在的AI公司卖订阅还是亏钱的,这也能部分解释Anthropic为何要封杀小龙虾这种超高Token消耗的应用的动机。

对国内开发者来说,还有一种降智的原因,那就是Anthropic会根据IP来定向降智,本质上也是分配算力的问题,但是以搞针对性IP/国家的方式,这种事也不止他们一家这么做,OpenAI等其他美国公司也被发现过用这种手段限制国内的开发者和用户。

【来源:快科技】
关于Claude Opus 4.6,AI大模型,降智问题,Anthropic,AI编程,算力,参数,开发者,逻辑测试,Mythos的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷