遭社区强烈反对后,Anthropic 调整 Claude Fable 5 面向研究员的“降智”措施
遭社区强烈反对后,Anthropic调整Claude Fable 5面向研究员的"降智"措施:从隐藏限智转为透明提示,用户将看到系统警告。点击了解最新变化!
6 月 11 日消息,此前,Anthropic 被曝会在用户不知情的情况下,限制竞争对手使用新模型 Claude Fable 5 开发其他 AI 模型。AI 研究社区强烈反对后,Anthropic 决定做出点改变。
Anthropic 在给《连线》的声明中致歉称:“我们正在调整 Fable 5 面向前沿模型开发的安全防护措施,让这些措施对用户可见。我们作出了错误权衡,也为没有拿捏好平衡而道歉。”
Anthropic 本周早些时候发布 Claude Fable 5。作为最新模型,Claude Fable 5 加入了额外护栏,用于防止滥用。用户如果询问网络安全、生物学或化学问题,系统会把请求转交给能力较弱的 AI 模型,以降低先进 AI 被用于网络攻击或生物武器制造的风险。
但面对使用 Claude Fable 5 从事前沿 AI 开发的研究人员,Anthropic 原本准备采用另一套更隐蔽的做法:在用户不知情的情况下,故意降低模型表现。换言之,研究人员如果试图用 Claude 训练竞争性 AI 模型,Claude Fable 5 可能会暗中“拖后腿”。
据了解,Anthropic 的服务条款明确禁止使用 Claude 训练竞争性 AI 模型。
官方最新给出的措施是,Claude Fable 5 面向 AI 开发的安全防护措施会改为对用户可见。如果 Anthropic 怀疑用户试图使用 Claude 构建高能力 AI,Anthropic 会明确提醒用户系统将拒绝请求,或将用户转到能力较弱的模型。
Anthropic 是在 AI 研究社区强烈反对后撤回该政策的。据了解,此前,其已限制竞争对手使用 Claude 构建闭源和开源 AI 模型,但批评者认为,面向特定用户悄悄降低模型性能已经越过界线。
当前,Claude 智能体已经成为许多开发者喜爱的工具,开源 AI 研究项目也在使用 Claude。多名研究人员告诉《连线》,如果 Anthropic 最新政策落地,先进 AI 研究未来可能被少数头部 AI 实验室垄断。
- 1重磅炸弹!曝《星际争霸》全新3A新作,或将马上亮相
- 2娱美德推进《夜鸦》在中国大陆的上线 IP新作年内上线
- 3《魔兽世界》倒计时一周!全新12.0.7版本“真相之幕”即将上线
- 4《泡泡堂》韩服宣布停运,盛趣回应:独立运营不受影响
- 5拳头离职大佬创业!新作虽说是“缝合怪”,但好评率仍高达81%
- 6遣返回国!日本“国宝级”美少女福田悠亚新西兰旅游被审讯6小时
- 7Steam新品节前瞻,推荐七款值得关注的多人联机/网游!
- 8绷不住了!电竞含片?智商税已经离谱到这个地步了?
- 9魔兽世界:时光服P4最新DPS排行,唯一三系登顶职业出现,雷火又开始造新神了
- 10正惊GIF:六大美女聚餐!桌上有说有笑,青春艳丽模样让无数人心动

