数学推理_新闻频道TAG标签系统_17173.com中国游戏第一门户站

DeepSeek V4中文能力测评出炉：重回国内第一！

SuperCLUE团队发布DeepSeek V4系列中文大模型测评结果，DeepSeek-V4-Pro凭借综合表现拿下国内第一，Flash版本紧随其后位居第二，国产开源模型再迎突破。本次测评覆盖数学推理、科学推理、代码生成...[详细]

标签：数学推理 DeepSeek V4 中文大模型测评代码生成

2026-04-28 09:00:27

边用边训：蚂蚁集团携手清华大学开源 AReaL 系统，训练 AI 推理最高提速 2.77 倍

3 月 4 日消息，蚂蚁集团携手清华大学联合推出开源强化学习训练框架 AReaL v1.0 稳定版，这是一种大规模异步强化学习系统，主要通过解耦生成与训练流程，来提升大语言模型（特别是推理模型）的训练效率。援引博文介绍，随着大语言模...[详细]

标签：数学推理 AReaL 强化学习大语言模型异步训练

2026-03-04 12:02:16

0

全球首个混合线性架构万亿参数思考模型开源：长文本推理效率提升3倍获IMO金牌

今日，蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T，在长文本生成、数学推理与智能体任务执行上达到开源领先水平，为智能体（Agent）时代的复杂任务处理提供高性能基础支撑。在生成效率上，...[详细]

标签：数学推理 Ring-2.5-1T 蚂蚁集团开源万亿参数

2026-02-13 13:00:54

0

全球中文大模型战力榜发布：前三被海外包揽国产有惊喜

今天，SuperCLUE发布2025年年度中文大模型基准测评报告。23个国内外模型参与角逐，覆盖数学推理、科学推理、代码生成等六大核心维度。从结果来看，海外闭源模型依旧占据头部位置，Anthropic旗下的Claude-...[详细]

标签：数学推理 SuperCLUE 中文大模型 Claude-Opus-4.5-Reasoning Gemini-3-Pro-Preview

2026-02-04 17:24:38

0

腾讯元宝：DeepSeek模式使用量较年初增长超100倍

今天，腾讯元宝发布的《元宝 x DeepSeek年度报告》。报告显示，自今年2月接入DeepSeek模型以来，其DeepSeek模式使用量持续飙升，12月14日单日使用量达全年峰值，较年初增长超100倍。当前腾讯元宝已稳居国...[详细]

标签：数学推理腾讯元宝 DeepSeek AI助手编程

2025-12-24 23:00:44

0

V4还没来 DeepSeekMath-V2数学模型来了：IMO奥赛金牌水平

全网都在等DeepSeek发布V4大模型，然而好事多磨，这个模型一直没有问世，但DeepSeek也没闲着，时不时来个惊喜，今晚突然低调发布了DeepSeekMath-V2模型。DeepSeekMath-V2是一款可自我验...[详细]

标签：数学推理 DeepSeekMath-V2 数学模型 IMO 奥赛金牌

2025-11-28 23:54:12

0

11月中文大模型基准测评出炉：GPT 5.1夺冠、DeepSeek开源第一

SuperCLUE公布了2025年11月中文大模型基准测评结果。本次测评围绕数学推理、科学推理、代码生成（含web开发）、幻觉控制、精确指令遵循五大核心任务展开，题目总量为822道新题，最终得分取各任务平均分。本次共测评...[详细]

标签：数学推理 GPT 5.1 DeepSeek 中文大模型基准测评

2025-11-28 23:44:52

0

Meta AI推理新论文：模型记住套路，推理token砍半

Meta 又一次在 AI 推理上“开了挂”。?一份新论文显示，Meta 的研究团队找到一种让大模型“用更少思维，想得更清楚”的办法。这篇论文名为《Metacognitive Reuse: Turning Recurring LLM Rea...[详细]

标签：数学推理 Meta AI 推理大语言模型行为手册

2025-10-15 18:33:52

0

拒绝“熵崩塌”和“熵爆炸”，这项研究让大模型学会“精确探索”，推理成绩飙升

大语言模型在RLVR训练中面临的“熵困境”，有解了！2024年以来，以OpenAI o1、DeepSeek-R1、Kimi K1、Qwen3等为代表的大模型，在数学、代码和科学推理任务上取得了显著突破。这些进展很大程度上得益...[详细]

标签：数学推理大语言模型 RLVR 熵正则化熵崩塌

2025-10-13 21:54:05

0

全自研芯片计算！百度智能云Qianfan-VL系列模型重磅开源

今日，百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL，并全面开源。即日起至10月10日，用户可在百度智能云千帆平台免费体验8B、70B模型。据介绍，Qianfan-VL系列模型包含3B、8B和70B三个尺...[详细]

标签：数学推理 Qianfan-VL 视觉理解模型多模态 OCR

2025-09-22 23:12:33

0

美团发布高效推理模型 LongCat-Flash-Thinking，达到 SOTA 水平

美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。官方介绍称，在保持了 LongCat-Flash-Chat 极致速度的同时，全新发布的 LongCat-Flash-Thinking 更...[详细]

标签：数学推理 LongCat-Flash-Thinking 推理模型智能体代码能力

2025-09-22 21:54:02

0

谷歌研究：合成数据使大模型数学推理能力提升八倍

最近，来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示，目前全球约有 300 万亿个公开可用的高质量文本训练标记。...[详细]

标签：数学推理谷歌合成数据

2025-04-07 20:12:54

0