本文由第三方AI基于17173文章http://news.17173.com/content/04302026/160121730.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
“哥布林”词频暴涨 175%,OpenAI 复盘称 AI 训练奖励机制意外“跑偏”
2026-04-30 16:01:21
神评论
17173 新闻导语
OpenAI揭秘GPT-5异常:哥布林词频暴涨175%,AI训练奖励机制意外跑偏!点击了解技术内幕与解决方案。
4 月 30 日消息,OpenAI 昨日(4 月 29 日)发布博文,复盘发现 GPT-5.1 系列及后续 AI 模型出现异常行为,在回答中频繁使用“哥布林”(goblin)和“小魔怪”(gremlin)等生物隐喻。
OpenAI 官方调查后发现,自从 GPT-5.1 系列发布以来,“哥布林”一词使用率上升 175%,“小魔怪”上升 52%。这一现象并非偶发,而是模型行为被特定奖励信号塑造的结果。



调查溯源发现,异常源于“书呆子”人格定制功能的训练过程。该功能仅占 ChatGPT 总回复量的 2.5%,却贡献了 66.7% 的“哥布林”提及量。

审计显示,原本用于鼓励该人格风格的奖励模型,在 76.2% 的数据集中对包含生物词汇的输出给予了更高评分。

技术团队发现,这种行为具有跨场景泛化能力。尽管奖励仅在“书呆子”条件下应用,但强化学习无法保证限制习得行为。
随着含生物词汇的输出被用于后续监督微调,模型形成了“奖励-生成-训练”的正反馈循环,导致该行为扩散至其他场景。附上相关图表如下:

OpenAI 针对此问题,已采取多项措施。技术团队移除了偏好生物词汇的奖励信号,并从训练数据中过滤了包含相关词汇的内容。受限于训练周期,GPT-5.5 未能完全规避此问题,开发团队通过添加指令提示进行了缓解。
参考
Where the goblins came from
【来源:IT之家】
热门测试游戏
- 1腾讯新作翻车?主策划亲笔4000字回复,补偿玩家价值2000元道具
- 2《暗黑破坏神4》国服免费领!官宣延长到8月,永久畅玩
- 3人人都在用的OBS,怎么就成了外挂神器?
- 4《星际公民》众筹破10亿美元!5000美元概念飞船开卖!
- 5《冒险岛怀旧服》国际版测试魔术师断层第一,史莱姆王遭5000次讨伐!
- 6网友吐槽粉木耳涉嫌性暗示 盒马道歉:已下架 坚决反对低俗不良信息
- 7极境飞升,剑启新章!!《剑网一》经典版2026年度资料片今日重磅上线!
- 8传统MMO让人望而生畏?这款轻松武侠搞了新模式,把焦虑给过滤了!
- 9《剑侠情缘·零》一周年盛会将至,庆典活动首波剧透来啦!
- 10韩援COSER小花生新照!太大了以至于没法批判什么!

