本文由第三方AI基于17173文章http://news.17173.com/content/04072025/153601754.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
中美 AI 挑战东京大学入学考试:双双合格,英语优异,数学欠佳
2025-04-07 15:36:02
神评论
据日经新闻 4 月 5 日报道,日本经济新闻与民间企业、大型补习班的联合研究发现,中美两国新型生成式 AI 已具备通过日本最难关东京大学理科 3 类入学考试的“学力”。两个模型在考察语言能力的英语中取得高分,但在数学中多次出现论证错误等问题。
此次测试让美国 OpenAI 的“o1”和中国 AI 初创公司 DeepSeek 的“R1”两个基础模型解答 2025 年度的东大入学考试题。AI 初创公司 Life Prompt(东京・新宿)输出了答案,并由大型预备学校河合塾的讲师进行评分。
大学入学共通考试和二次考试合计的理科得分(IT之家注:满分 550 分)中,o1 获得了 374 分,R1 获得了 369 分,两者均超过了东大在 3 月 10 日公布的理科 3 类合格最低分数线(368.7 分)。
R1 在理科 1 类和理科 2 类的共通考试中未达到合格最低分数线,但在其他科类中,与 o1 一起包括文科在内都“合格”了。
在二次考试中,得分率较高的是英语,o1 和 R1 的得分率均超过了 75%。河合塾负责英语的久恒秀雄讲师表示:“几乎没有单词和语法的错误,远远超过了东大考生的平均水平。”
数学方面,虽然最终答案正确的问题较多,但在图形和论证问题上多次出现论述错误和说明不足的情况。理科数学中,o1 在 120 分满分中得了 38 分,R1 得了 49 分。负责数学的香坂季京讲师指出:“这比合格者的平均分要低很多。”
自 2011 年开始的“机器人能否进入东京大学(东 Robo)”项目的负责人、国立信息学研究所的新井纪子教授对此次考试结果评价道:“这是 AI 成长的一个重要里程碑。不过,AI 有时会给出相当糟糕的答案,需要能够正确判断并熟练使用 AI 输出的人才。”
【来源:IT之家】
今日热点
热门测试游戏
- 1魔兽故事:魔兽最虚伪的守护者!篡改史书洗白自己,亲手玩崩英灵殿
- 2《龙之剑:觉醒》公开预告视频 首个冒险地区曝光
- 3《洛奇英雄传:反抗命运》公开全景欣赏功能和成就系统
- 4又一款经典童年网游!《飘流幻境》复刻重置,Q版画风超高自由度
- 5《剑灵》韩服直播爆料总结,NEO巅峰服武功体系改版究竟是什么?
- 6最近大家都在玩什么?盘点五款近期在Steam热度霸榜的网游,两款即将上国服!
- 75月热游情报:《命运2》宣布将停止更新!《洛克王国:世界》陷入巨大舆论风波
- 8《仙境传说RO》IP新作MMO美服测试将于6月4日开启
- 9回忆录:以为白捡一个号,结果免费当“代练”一年多,这口气实在咽不下!
- 10《望月》新实机演示:都市开放世界的赛道,终于卷出了差异化


