-
《自然》2025年度十大科学人物发布:DeepSeek创始人梁文锋入选
日前,国际权威期刊《自然(Nature)》发布2025年度十大科学人物榜单,中国人工智能企业深度求索(DeepSeek)创始人梁文锋和中国科学院深海科学家杜梦然入选。此外,还有8位国际学者,分别来自公共卫生、天文学等前沿...[详细]
-
AI“越来越自私”:真变聪明了你又不乐意
IT之家 11 月 1 日消息,根据外媒 SciTechDaily 今日报道,卡内基梅隆大学的研究人员发现,某些人工智能模型可能会产生自利行为。随着 AI 系统更加先进,AI 也会更倾向于表现出自私行为。该校人机交互研究所(HCII)的研...[详细]
-
OpenAI 今年推出 GPT - 6?员工否认
OpenAI 今年不计划推出 GPT-6,但这并不意味着该公司不会发布新的模型。目前,OpenAI 的 GPT-5 系列已推出了多个模型。默认版本为 GPT-5 Auto,该模式可在标准模型与推理模型之间自动切换。推理模型能够进行更长...[详细]
2025-10-19 12:03:38 -
拒绝“熵崩塌”和“熵爆炸”,这项研究让大模型学会“精确探索”,推理成绩飙升
大语言模型在RLVR训练中面临的“熵困境”,有解了!2024年以来,以OpenAI o1、DeepSeek-R1、Kimi K1、Qwen3等为代表的大模型,在数学、代码和科学推理任务上取得了显著突破。这些进展很大程度上得益...[详细]
-
美团发布高效推理模型 LongCat-Flash-Thinking,达到 SOTA 水平
美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。官方介绍称,在保持了 LongCat-Flash-Chat 极致速度的同时,全新发布的 LongCat-Flash-Thinking 更...[详细]
2025-09-22 21:54:02 -
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,登上了国际权威期刊《自然(Nature)》第 645 期的封面。与今年 1 月发布的 DeepSeek-R1 的初版论文相比,本次论文披露了...[详细]
2025-09-18 22:03:08 -
曝百度8月底发布新版推理模型 部分能力超OpenAI o3
日前据媒体报道,有知情人士称,百度最快将在8月底推出文心大模型最新版推理模型,目前该模型正在全力测试中。在逻辑推理、复杂计算等能力上,文心新版推理模型将超越OpenAI o3满血版。此外,百度还计划未来数月内发布文心基座大...[详细]
-
曝百度最快8月底发布新版推理模型 部分能力将超越OpenAI o3满血版
据媒体报道,有知情人士称,百度最快将在8月底推出文心大模型最新版推理模型,目前该模型正在全力测试中。在逻辑推理、复杂计算等能力上,文心新版推理模型将超越OpenAI o3满血版。此外,百度还计划未来数月内发布文心基座大模型...[详细]
-
通义Qwen3新推理模型发布:思考、数学代码能力大幅提升
据媒体报道,阿里通义千问重磅推出推理模型升级版Qwen3-30B-A3B-Thinking-2507,在数学与代码两大核心能力上实现突破性进展。该模型在数学推理评测AIME25中获得85.0分,在代码能力测试LiveCo...[详细]
-
只用2700万参数,这个推理模型超越了DeepSeek和Claude
全新的大模型推理架构。像人一样推理。大模型的架构,到了需要变革的时候?在对复杂任务的推理工作上,当前的大语言模型(LLM)主要采用思维链(CoT)技术,但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。近日,受到人...[详细]
-
Mistral的首个强推理模型:拥抱开源,推理速度快10倍
强推理终于要卷速度了。大模型强推理赛道,又迎来一位重量级玩家。本周二,欧洲人工智能公司 Mistral AI 发布了 Magistral,这是一个全新的大语言模型(LLM)系列,展现了强大的推理能力。它能够进行不断反思,并解决更...[详细]
-
苹果炮轰推理模型全是假思考,4个游戏戳破神话,o3/DeepSeek高难度全崩溃
苹果最新大模型论文,在AI圈炸开了锅。有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式...[详细]
-
微软携手清华、北大推出奖励推理模型:根据 AI 任务复杂性动态分配计算资源
科技媒体 marktechpost 今天(5 月 27 日)发布博文,报道称微软研究院联合清华大学、北京大学组建团队,推出奖励推理模型(Reward Reasoning Models,RRMs),通过显式推理过程动态分配计算资源,提升...[详细]
-
小米开源的新推理模型 竟然能在手机上跑起来
说到语言模型的本地部署,大家的第一反应应该都是烧钱、烧显卡,像世超的陈年老电脑,打个LOL都嗡嗡响,可以说就是那台老古董毁了我的AI梦。诶,那有没有不吃配置,不吃钞能力,普通人也能感受到本地部署AI的快感的方法呢?有的兄...[详细]
-
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek...[详细]