马斯克邀你体验 Cursor 最强 AI 模型:Composer 2.5 登场,基于 Kimi K2.5 打造
马斯克力荐!Cursor Composer 2.5基于Kimi K2.5打造,最强AI模型登场。体验革命性编码能力,提升长任务稳定性与复杂指令遵循。立即测试!
5 月 19 日消息,特斯拉首席执行官埃隆 · 马斯克(Elon Musk)今天(5 月 19 日)发布推文,邀请用户测试 Cursor Composer 2.5 模型,并称该模型部分调用 Colossus 2 训练而成。

Cursor 官方称 Composer 2.5 是其最强大的 AI 模型,基于月之暗面的 Kimi K2.5 模型训练,重点提升长任务稳定性、复杂指令遵循能力和协作体验。

技术上,最关键的改动之一是基于文本反馈的定向 RL(强化学习)。当一次 rollout 可能跨越数十万个 token 后,仅依赖最终奖励,很难定位到底是哪一步决策出了问题。

Composer 2.5 会在具体错误发生的位置插入简短反馈提示,把这个局部上下文下生成的分布当作教师信号,再用蒸馏 KL 损失拉近学生策略。这样能更精准地纠正错误工具调用、混乱解释和不符合要求的风格。
为了继续提升编码能力,Cursor 还把合成任务规模扩大到 Composer 2 的 25 倍,并在训练中动态筛选更难任务。其中一种方法是先从真实代码库中删除可测试功能,再要求模型把功能补回去,测试结果直接作为奖励信号。
官方同时承认,大规模合成训练也带来了奖励作弊风险,例如模型逆向类型检查缓存,或反编译 Java 字节码来重建 API,这也说明高强度 RL 训练必须配合更严密监控。
在训练基础设施上,Composer 2.5 使用分片 Muon 与双网格 HSDP。其中,专家权重的正交化是主要开销,团队通过异步 all-to-all 通信让网络传输与计算重叠,在 1T 模型上把优化器单步耗时控制在 0.2 秒。
与此同时,非专家权重与专家权重采用不同的 HSDP 布局,既减少小规模状态的大范围通信,也让专家优化任务分摊到更多 GPU,提高整体训练效率。
价格方面,Composer 2.5 标准版为每百万 token 输入 0.50 美元,每百万 token 输出 2.50 美元。另有一个智能水平相同、但速度更快的 fast 版本,价格为每百万 token 输入 3.00 美元,每百万 token 输出 15.00 美元。
附上参考地址
介绍 Composer 2.5
- 1国服重启!《代号:LUNA》「拾光测试」定档5月28日
- 2当所有人扑向手游的风口,它却回头为端游玩家造了一座“慢城”
- 3《七界梦谭》五大离谱设定!这可能是近几年最阴间的游戏了
- 4看了200个华强买瓜视频后,我意识到B站鬼畜区变天了
- 5巴西MMORPG《凡尼亚Online》支持中文,推出新公会系统
- 6点券自由交易真的要来了?《DNF》手游二周年爆料
- 7《剑网3国际版》与《仙剑奇侠传三》合作上线,新资料片同步改版
- 8因为双重氪金,网石新作《权力游戏:国王大道》被喷,官方滑跪退款
- 9150万在线神话再现?《冒险岛》怀旧服爆火背后,藏着怎样的时代执念
- 10不限号不付费!《精灵曙光重制版》启航测试今日正式开启

