推理模型_新闻频道TAG标签系统_17173.com中国游戏第一门户站

AI 推翻著名几何猜想，OpenAI 宣布攻克 **数学难题

5 月 21 日消息，OpenAI 称其全新推理模型推导出了一个原创数学证明，推翻了几何学中一道著名的未解猜想。该猜想最早由保罗?埃尔德什于 1946 年提出。注意到，OpenAI 已不是第一次放出这般大胆的言论。七个月前，这家人工智...[详细]

标签：推理模型 OpenAI 数学证明几何猜想埃尔德什难题

2026-05-21 16:05:49

0

微软 VS Code 1.116 发布：内置 GitHub Copilot，调试 AI 更透明

4 月 16 日消息，微软今天更新发布 Visual Studio Code 1.116 版本，内置 GitHub Copilot 为默认功能，用户无需安装扩展，首次启动即可直接使用 AI 辅助编程功能。针对 AI 调试体验，新版本引入了 Agent D...[详细]

标签：推理模型 Visual Studio Code GitHub Copilot AI 辅助编程 Agent Debug Logs

2026-04-16 16:04:06

0

林俊旸从阿里离职后首发长文：复盘千问路线受阻，断言 AI 演进全面转向智能体

感谢网友 HH_KK 的线索投递！ 3 月 27 日，前阿里千问技术负责人林俊旸离职后发表长文，明确指出 AI 大模型的发展路线正在经历重大跨越，核心竞争焦点正从“推理型思考（Reasoning Thinking）”全面转向“智能体思考（...[详细]

标签：推理模型 AI 智能体思考强化学习大模型

2026-03-27 08:05:58

0

Mistral 发布 119B-A6B 模型 Small 4，首次兼顾推理、多模态、编程优势

3 月 20 日消息，Mistral AI 当地时间本月 16 日宣布推出 Mistral Small 4 模型，这是这家欧洲领先 AI 实验室首款结合旗舰推理模型、多模态模型、编程模型优势的综合性 LLM，用户无需在多种各有优势的模型中进行选择，...[详细]

标签：推理模型 Mistral AI Mistral Small 4 LLM MoE架构

2026-03-20 12:03:44

0

边用边训：蚂蚁集团携手清华大学开源 AReaL 系统，训练 AI 推理最高提速 2.77 倍

3 月 4 日消息，蚂蚁集团携手清华大学联合推出开源强化学习训练框架 AReaL v1.0 稳定版，这是一种大规模异步强化学习系统，主要通过解耦生成与训练流程，来提升大语言模型（特别是推理模型）的训练效率。援引博文介绍，随着大语言模...[详细]

标签：推理模型 AReaL 强化学习大语言模型异步训练

2026-03-04 12:02:16

0

即刻体验！千问PC和网页端接入国内最强推理模型Qwen3-Max-Thinking

1月26日，阿里正式发布旗舰推理模型Qwen3-Max-Thinking，AI助手千问同步在PC端和网页端（qianwen.com）接入这一国内最强“AI大脑”，千问App也即将接入。用户只需在模型选择栏中一键切换，即可...[详细]

标签：推理模型千问 Qwen3-Max-Thinking AI助手 PC端

2026-01-27 15:01:58

0

阿里千问最强模型重磅亮相：性能媲美GPT-5.2、Gemini 3 Pro

阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking，创下数项权威评测全球新纪录，性能媲美GPT-5.2、Gemini 3 Pro，成为迄今为止最接近国际顶尖模型的国内最强AI大模型。通过总参数、强化学习、推理计...[详细]

标签：推理模型 Qwen3-Max-Thinking GPT-5.2 Gemini 3 Pro AI大模型

2026-01-27 05:21:06

0

谷歌新发现：DeepSeek 推理分裂出多重人格，左右脑互搏越来越聪明

AI 变聪明的真相居然是正在“脑内群聊”？！谷歌最新研究表明，DeepSeek-R1 这类顶尖推理模型在解题时，内部会自发“分裂”出不同性格的虚拟人格，比如外向的、严谨的、多疑的……大模型的解题推理过程，就是这些人格一场精彩...[详细]

标签：推理模型 DeepSeek-R1 多重人格左右脑互搏谷歌研究

2026-01-20 18:57:36

0

黄仁勋新年第一场演讲提了DeepSeek 推动了整个行业变革

第一财经报道，在拉斯维加斯的英伟达发布会上，CEO黄仁勋回顾了过去一年AI行业的进展，指出开源模型的兴起已成为全球创新的重要催化剂。他特别提到，DeepSeek-R1的出现意外推动了整个行业的变革。黄仁勋表示，当前全球涌...[详细]

标签：推理模型黄仁勋英伟达 DeepSeek AI

2026-01-06 10:52:11

0

《自然》2025年度十大科学人物发布：DeepSeek创始人梁文锋入选

日前，国际权威期刊《自然（Nature）》发布2025年度十大科学人物榜单，中国人工智能企业深度求索（DeepSeek）创始人梁文锋和中国科学院深海科学家杜梦然入选。此外，还有8位国际学者，分别来自公共卫生、天文学等前沿...[详细]

标签：推理模型 DeepSeek 梁文锋 R1大模型人工智能

2025-12-09 08:03:58

0

AI“越来越自私”：真变聪明了你又不乐意

IT之家 11 月 1 日消息，根据外媒 SciTechDaily 今日报道，卡内基梅隆大学的研究人员发现，某些人工智能模型可能会产生自利行为。随着 AI 系统更加先进，AI 也会更倾向于表现出自私行为。该校人机交互研究所（HCII）的研...[详细]

标签：推理模型 AI 自私行为合作大语言模型

2025-11-02 09:04:05

0

OpenAI 今年推出 GPT - 6？员工否认

OpenAI 今年不计划推出 GPT-6，但这并不意味着该公司不会发布新的模型。目前，OpenAI 的 GPT-5 系列已推出了多个模型。默认版本为 GPT-5 Auto，该模式可在标准模型与推理模型之间自动切换。推理模型能够进行更长...[详细]

标签：推理模型 OpenAI GPT-6 GPT-5 GPT-5 Auto

2025-10-19 12:03:38

0

拒绝“熵崩塌”和“熵爆炸”，这项研究让大模型学会“精确探索”，推理成绩飙升

大语言模型在RLVR训练中面临的“熵困境”，有解了！2024年以来，以OpenAI o1、DeepSeek-R1、Kimi K1、Qwen3等为代表的大模型，在数学、代码和科学推理任务上取得了显著突破。这些进展很大程度上得益...[详细]

标签：推理模型大语言模型 RLVR 熵正则化熵崩塌

2025-10-13 21:54:05

0

美团发布高效推理模型 LongCat-Flash-Thinking，达到 SOTA 水平

美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。官方介绍称，在保持了 LongCat-Flash-Chat 极致速度的同时，全新发布的 LongCat-Flash-Thinking 更...[详细]

标签：推理模型 LongCat-Flash-Thinking 智能体数学推理代码能力

2025-09-22 21:54:02

0

DeepSeek-R1 论文登上《自然》封面，通讯作者为梁文锋

由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文，登上了国际权威期刊《自然（Nature）》第 645 期的封面。与今年 1 月发布的 DeepSeek-R1 的初版论文相比，本次论文披露了...[详细]

标签：推理模型 DeepSeek-R1 大语言模型强化学习人工智能

2025-09-18 22:03:08

0

曝百度8月底发布新版推理模型部分能力超OpenAI o3

日前据媒体报道，有知情人士称，百度最快将在8月底推出文心大模型最新版推理模型，目前该模型正在全力测试中。在逻辑推理、复杂计算等能力上，文心新版推理模型将超越OpenAI o3满血版。此外，百度还计划未来数月内发布文心基座大...[详细]

标签：推理模型百度 OpenAI

2025-08-08 09:39:05

0

曝百度最快8月底发布新版推理模型部分能力将超越OpenAI o3满血版

据媒体报道，有知情人士称，百度最快将在8月底推出文心大模型最新版推理模型，目前该模型正在全力测试中。在逻辑推理、复杂计算等能力上，文心新版推理模型将超越OpenAI o3满血版。此外，百度还计划未来数月内发布文心基座大模型...[详细]

标签：推理模型百度 OpenAI

2025-08-07 17:39:02

0

通义Qwen3新推理模型发布：思考、数学代码能力大幅提升

据媒体报道，阿里通义千问重磅推出推理模型升级版Qwen3-30B-A3B-Thinking-2507，在数学与代码两大核心能力上实现突破性进展。该模型在数学推理评测AIME25中获得85.0分，在代码能力测试LiveCo...[详细]

标签：推理模型通义Qwen3 数学代码

2025-07-31 14:21:01

0

只用2700万参数，这个推理模型超越了DeepSeek和Claude

全新的大模型推理架构。像人一样推理。大模型的架构，到了需要变革的时候？在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。近日，受到人...[详细]

标签：推理模型 2700万参数 DeepSeek

2025-07-01 13:57:02

0

Mistral的首个强推理模型：拥抱开源，推理速度快10倍

强推理终于要卷速度了。大模型强推理赛道，又迎来一位重量级玩家。本周二，欧洲人工智能公司 Mistral AI 发布了 Magistral，这是一个全新的大语言模型（LLM）系列，展现了强大的推理能力。它能够进行不断反思，并解决更...[详细]

标签：推理模型 Mistral 开源

2025-06-11 22:45:16

0

苹果炮轰推理模型全是假思考，4个游戏戳破神话，o3/DeepSeek高难度全崩溃

苹果最新大模型论文，在AI圈炸开了锅。有人总结到：苹果刚刚当了一回马库斯，否定了所有大模型的推理能力。这篇论文称推理模型全都没在真正思考，无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式...[详细]

标签：推理模型苹果游戏

2025-06-09 23:27:13

0

微软携手清华、北大推出奖励推理模型：根据 AI 任务复杂性动态分配计算资源

科技媒体 marktechpost 今天（5 月 27 日）发布博文，报道称微软研究院联合清华大学、北京大学组建团队，推出奖励推理模型（Reward Reasoning Models，RRMs），通过显式推理过程动态分配计算资源，提升...[详细]

标签：推理模型微软清华

2025-05-27 19:12:07

0

小米开源的新推理模型竟然能在手机上跑起来

说到语言模型的本地部署，大家的第一反应应该都是烧钱、烧显卡，像世超的陈年老电脑，打个LOL都嗡嗡响，可以说就是那台老古董毁了我的AI梦。诶，那有没有不吃配置，不吃钞能力，普通人也能感受到本地部署AI的快感的方法呢？有的兄...[详细]

标签：推理模型小米手机

2025-05-10 08:06:04

0

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1

阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek...[详细]

标签：推理模型阿里

2025-03-06 20:51:28

0