本文由第三方AI基于17173文章http://news.17173.com/content/04172026/200939538.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
美国医学会旗下期刊:现阶段 AI 难以直接应用于临床决策,早期诊断错误率达到 80%
2026-04-17 20:09:39
神评论
17173 新闻导语
美国医学会期刊研究揭示:AI在临床早期诊断错误率超80%,GPT-5等主流模型在鉴别诊断阶段表现最差,难以直接用于医疗决策。点击了解详情!
4 月 17 日消息,美国医学会旗下期刊 JAMA Network Open 发文,透露业界现有的大型语言模型(LLMs)在临床推理方面仍存在明显短板,尤其是在早期的鉴别诊断阶段,错误率普遍超过 80%。
参考论文获悉,研究团队利用 29 个标准化临床案例对 GPT-5、Claude 4.5 Opus、Gemini 3、Grok 4 等 21 款主流大模型进行评测,模拟完整医疗决策流程,覆盖鉴别诊断、检查选择、最终诊断、治疗管理及其他临床推理五个阶段。

结果显示,各大模型整体表现存在一定差异,同时在不同诊疗阶段呈现出明显不均衡。具体来看,AI 在“最终诊断”和“治疗管理”环节的准确率相对较高,“检查选择”和其他推理能力处于中等水平,而在最早期的“鉴别诊断”阶段表现最差,错误率普遍超过 80%,也就是模型通常会误判病人的具体疾病。
进一步分析认为,AI 更擅长在信息相对完整的情况下给出答案,但在信息不足、需要逐步推理的早期阶段,往往容易过早收敛到单一结论,导致当前 AI 难以直接应用于临床决策。相比之下,临床医生通常会在初期保留多种可能性,并随着检查结果和信息积累不断修正判断,最终定论患者的具体疾病。
【来源:IT之家】
热门测试游戏
- 1对于单机孤狼玩家,腾讯国服《弧光猎人》或许是更合适的选择
- 2《剑星:血雨》新女主伊薇太幼引争议 网友举例韩妹打脸老外
- 3掌控禁忌,役使恶魔!《暗黑破坏神:不朽》全新职业“术士”今日正式上线
- 4NEXON将延续《泡泡堂》IP 承诺其他IP暂无停运计划
- 5《上古世纪归来》公布先驱测试计划 原厂正版授权重启经典端游
- 6《魔域》重大活动今日上线 海量福利共赴守护之约
- 7风靡全球的《宝可梦GO》 把300亿张照片卖给了美国军方
- 8Nexon新作MMO《无冕之烬》免费试玩开启!截止6月22日
- 9《龙之谷》6月17日更新上线:勇者讨伐战第2季单人开战,全新龙玉与周年庆预热同步登场
- 10八年磨一剑!《太吾绘卷:天幕心帷》完整版今日正式上线

