本文由第三方AI基于17173文章http://news.17173.com/content/05092026/180235527.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
MiniMax大模型认不出马嘉祺!官方终于给出原因
2026-05-09 18:02:35
神评论
17173 新闻导语
MiniMax大模型为何认不出马嘉祺?官方揭秘:因'嘉祺'在后训练数据中出现频次过低,导致模型遗忘该token生成能力。现已修复并建立监控机制,点击了解技术细节!
近期有网友发现一个有趣的现象:MiniMax 模型似乎无法正常识别马嘉祺三个字。
起初大家都以为只是偶然出现的小漏洞,但多方实测后发现情况有些离谱:不管切换不同接口、更换使用平台,该问题都能稳定复现。
翻看网友测试截图以及实际调用返回结果能看出,模型其实可以检索到马嘉祺的相关资料,也能完整准确输出他的个人履历、相关经历等信息。可唯独只要提及本名,模型就会出现文字错乱、随意改写名字的情况。
简单来说,人物背景信息基本无误,对应人物也完全匹配,唯独在识别和输出姓名时频频出错。
那么为什么会出现这种情况呢?
今日,MiniMax官微发长文回应M2系列模型无法说出马嘉祺一事,提供了对“嘉祺识别”问题的完整排查过程和技术思考。
MiniMax表示,其从分词器版本对齐、embedding统计分布、语义近邻检索、预训练与后训练模型的few-shot对比实验、后训练数据频次统计以及对全词表lm_head变化幅度的排序扫描等多个维度进行了排查。

最终定位到的原因是:嘉祺在分词器中被合并为一个独立token,但该token在后训练数据中出现频次极低,导致模型在后训练中逐渐遗忘了对该token的生成能力。
修复方案方面,MiniMax构造了一份覆盖全词表的合成数据,核心思想是:通过一个简单的复读任务,为全词表建立一个生成频率的“下限保障”,防止任何token因为完全缺失而退化。
此外,MiniMax表示,将token覆盖度作为后训练数据质量的一项常规监控指标,可以在早期发现潜在的稀疏token退化风险,避免类似问题在线上复现。

【来源:快科技】
关于的新闻
- IT早报 0510:SK 海力士回应“员工人均奖金 610 万人民币”;多家车企辟谣“锁电”被约谈;曝 iPhone 18 Pro 灵动岛缩小 25%;DeepSeek 大范围开放“识图模式”... 2026-05-10
- 《连线》称“我会稳稳地接住你”成为 ChatGPT AI 中文口头禅 2026-05-09
- MiniMax 不认马嘉祺?稀宇科技公布大模型“失语”原因:特定词元后训练不足导致 2026-05-09
- 我国日均 Token(词元)调用量飙涨超 100000%、两年增长超千倍 2026-05-09
- 500亿元融资到手 DeepSeek V4大模型6月还有重大升级 2026-05-08
热门测试游戏
- 15月公测手游盘点:腾讯新作上线!虚渊玄携武侠回归
- 2绅士日报:腾讯代理新游暗藏成人向画面?泳池温泉边全是大雷美女湿身诱惑!
- 3《马拉松》玩家人数惨淡 但Bungie仍将继续运营下去
- 4八年磨一剑!《剑灵:革命》官宣升级虚幻引擎5,重塑次世代MMO体验
- 5伊芙体模申才恩回SHIFTUP工作室 或为《剑星2》而来
- 6整治了20年,网游工作室为何屡禁不止?
- 7两张来自2001年的魔兽世界截图,你从未见过的Alpha内测版本
- 8今年最上头的国产“赌狗”游戏,为什么能让无数玩家边骂边玩?
- 9魔兽故事:五百年前是一家!暴雪官宣精灵与巨魔是同族,阿强心态崩了
- 10《剑星2》开发细节曝光!伊芙体模回归,新舞台登陆“山城重庆”?

