人人都能是配音导演，阶跃星辰发布语音生成模型 StepAudio 2.5 TTS

2026-04-16 16:02:26 神评论

17173 新闻导语

阶跃星辰发布StepAudio 2.5 TTS语音生成模型，支持全局语境控制、文中语境调节和零样本音色复刻，让AI演文本而非念文本，人人都能成为配音导演！

4 月 16 日消息，阶跃星辰今日发布新一代语音生成模型 StepAudio 2.5 TTS，官方号称人人都能是配音导演。

阶跃星辰官方表示，该语音合成模型首次将语境理解能力引入语音生成全流程。通过 Global Context（全局语境）+ Inline Context（文中语境）双档控制，搭配 Zero-shot 音色复刻，让 AI 不是念文本，而是演文本。

StepAudio 2.5 TTS 支持以下核心能力：

全局语境控制：支持自定义整段语音的情绪基调、角色状态与场景氛围，使表达更统一、更连贯。

文中语境控制：不仅能控制一句话怎么说，还能进一步调节语气、节奏、停顿、轻重变化、角色感和场景感，让声音表达更有分寸。

零样本复刻与全音色控制：在保留目标音色特征的同时，支持对情感、风格和表达方式进行灵活调节，让同一种声音说出更多不同感觉。

附官方演示网址如下：

https://stepaudiollm.github.io/step-audio-2.5-tts/zh.html

【来源：IT之家】

关于StepAudio 2.5 TTS,语音生成模型,阶跃星辰,全局语境控制,文中语境控制,零样本复刻,音色控制,语音合成,AI配音,语境理解的新闻