阶跃星辰发布新一代实时语音大模型 StepAudio 2.5 Realtime,支持情绪感知与人设自定义
阶跃星辰发布StepAudio 2.5实时语音大模型!支持情绪感知与人设自定义,打造更具“活人感”的AI对话体验,评测表现超越GPT与Gemini。立即了解详情!
5 月 9 日消息,阶跃星辰昨晚发布了新一代实时语音大模型 StepAudio 2.5 Realtime,目前已全量上线,开发者可通过阶跃星辰开放平台接入使用。
该模型定位于打造更具“活人感”的 AI 对话体验,重点围绕副语言感知、人设自定义与对话能力三个方向进行技术升级。

从官方获悉,StepAudio 2.5 Realtime 的核心突破在于其对“副语言”信息的处理能力。所谓副语言,指的是语调、语速、停顿乃至一声叹息或轻笑等文字以外的表达方式,这些细节恰恰是人类情感传递的主要载体。模型通过对这些元素的解读,可以感知对话者的情绪状态与潜在意图,比如从低沉的声线中察觉疲惫,或是从急促的语气里识别出烦躁情绪,并据此动态调整回应的语气与策略,旨在降低交互的生硬感,使其更像与真人交谈。
在人设灵活性方面,StepAudio 2.5 Realtime 将定义权完全交给用户。开发者可以通过 API,从性格特质、背景经历、个人好恶到语言习惯与对话边界,对 AI 角色进行精细化调节。这一能力的背后,是模型基于超过 10,000 个高质量原生人设,通过算法裂变生成的百万级人设特征矩阵,并结合海量真实场景对话语料训练而来。针对深度角色扮演中常见的“人设崩塌”痛点,开发团队进行了专门的 RLHF(基于人类反馈的强化学习)对齐优化。据官方介绍,即使在极端情境的压力测试下,模型依然能保持高度稳定、可信的角色一致性。同时,该模型也内置了 5 个预设人设供用户直接选择体验。

在整体对话能力上,该模型强调智商与情商的双重跃升。除了深度理解复杂语义、应对抛梗接梗等交流场景,模型还能灵活调用多领域知识以提供更深度的对话体验,在应用中既可扮演提供情绪价值的聊天搭子,也能模拟专业 HR 进行面试等严肃场景。
根据官方发布的 2026 年 4 月评测数据,该模型在五个测试维度中均位列第一。其中最能反映真实体验的主观评测(手机 App 真人对话打分)得分 80.41,高于 GPT-Realtime-1.5 的 68.01 和 Gemini Live 的 67.16;语音问答基准得分为 79.80,约为 GPT-Realtime-1.5 的 1.5 倍。
- 1快手做MMO、祖龙做卡牌,谁才是“诡秘”IP的正确打开方式?
- 2离谱大瓜!三角洲头部主播轻信5亿画饼反被骗20万
- 3魔兽故事:笑死!魔兽“吃饭睡觉打巨魔”的锅,一半都要扣在这哥们头上
- 4日本厂商终于想通了:PC平台才是印钞机
- 5曾被誉为3D版DNF的《疾风之刃》回归,是否还能打动新老玩家?
- 63小时说完《冒险岛》国服历史:从内测到大巨变,大量首次公开的挖掘与考据
- 7开发8年的国产武侠终于正式上线!盘点本月发售的新游
- 8回忆录:没有零花钱的学生时代,靠着自己的耐力,赚足了传奇点卡钱和网费
- 9“海岛爽游?”强势对标去年的逃出美女岛,试玩解析!
- 10本月五大热门游戏全新版本内容全面盘点,《燕云十六声》正式步入“江南时代”

