本文由第三方AI基于17173文章http://news.17173.com/content/09192025/092106686.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
打破蒸馏质疑!DeepSeek梁文锋论文登上《自然》封面
2025-09-19 09:21:07
神评论
17173 新闻导语
DeepSeek梁文锋团队论文登上《自然》封面,突破性AI模型DeepSeek-R1成本仅294000美元,颠覆AI高投入认知,引领国际AI界新潮流。
9月18日消息,据媒体报道,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,近日登上国际顶级学术期刊《自然》(Nature)的封面,引发广泛关注。
与今年1月发布的初版论文相比,本次正式发表的版本披露了更多模型训练的技术细节,并对发布初期外界有关“蒸馏”方法的质疑作出了正面回应。
DeepSeek-R1也因此成为全球首个经过严格同行评审的主流大语言模型。《自然》在评论中指出,当前绝大多数主流大模型尚未经过独立的同行评审,而这一重要空白“终于被DeepSeek打破”。
值得一的是,补充材料首次公开了R1训练成本——294000美元,数字低到惊人。即便是加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。
公开资料显示,DeepSeek创始人梁文锋毕业于浙江大学电子信息与通信工程专业,获本科及硕士学位。他于2023年7月创立DeepSeek,公司在2024年5月推出DeepSeek-V2,同年12月27日发布DeepSeek-V3。
2025年1月20日,DeepSeek正式发布DeepSeek-R1模型。该模型犹如一颗投入平静湖面的巨石,在国际AI界激起千层浪,不仅颠覆了“AI研发必须高投入、长周期”的传统认知,也打破了美国在AI领域的话语垄断。
【来源:互联网】
热门测试游戏
- 122年前,这款韩游靠一个玩法惊艳全世界,连魔兽都来拜师学艺
- 2过不了审!《棕色尘埃2》尺度太逆天官方油管被封
- 3《暗黑4》又翻车了?这次是因为一个马虎的员工
- 4暴雪老兵新作《上古守护》宣布停服 Steam破例允许无视游玩时长退款
- 5昆凌发了和周杰伦的vlog 疑似回应周杰伦争议事件
- 6里昂裸体mod再激起性别双标争议 男女性化标准统一这么难
- 7飞翔不设限,归来仍少年 《飞飞:无限宇宙》技术测试4月3日开启
- 8二次元“贫乳”标准越来越离谱?有画师吐槽:现在连D都算小了
- 9腾讯Q版三国回合制RPG《三国志异闻录》3月17日上线
- 10《魔兽世界》玩家热议!银月城重制是暴雪干的最正确的一件事!太美了!



