17173 > 游戏资讯 > 科技新闻 > 正文

Stability AI 推出音频模型 Stability Audio 3.0,可生成最长 6 分钟专业级歌曲

2026-05-21 02:01:56 神评论
17173 新闻导语

Stability AI发布音频模型Stability Audio 3.0,可生成最长6分钟专业级歌曲!四款规格可选,中小型开源,大型版支持API。了解如何创作完整乐曲。

5 月 20 日消息,据外媒 TechCrunch 今晚报道,AI 初创公司 Stability AI 推出全新音频生成模型家族 Stability Audio 3.0,其顶级版本据称可生成长达六分钟以上的专业级音乐。

Stability AI 此次共推出了四款不同规格的模型,分别为:45900 万参数的小型 XFS 与小型版、14 亿参数的中型版,以及 27 亿参数的大型版。其中,两款小型模型专注于设备端运行,可本地生成两分钟以内的声音与音乐。

中型和大型模型则展现出更强的架构控制力,能够创作长达 6 分钟 20 秒的完整乐曲,并精准维持音乐结构与旋律基调。这一长度与 2024 年该公司推出的 Stable Audio 2.0 相比,实现了翻倍以上的跨越。

为了回馈开源社区,Stability AI 已将小型 SFX、小型及中型模型开源,公众可以自由下载并修改权重。不过,最顶尖的大型模型目前仅通过 API 与付费托管服务提供,且年营收超过 100 万美元(注:现汇率约合 682.1 万元人民币)的企业必须购买商业授权。

为了规避合规风险,Stability AI 在去年就已同华纳音乐集团、环球音乐集团达成深度合作。该公司强调,此次推出的最新音频模型全量基于合法授权的数据集训练而成。

Stability AI 目前正紧锣密鼓地为专业音乐人打造一套全新产品线,不过尚未公布具体功能细节。为了推进该项目,曾先后担任环球音频与芬达首席数字官的伊桑 · 卡普兰已正式加盟,负责领衔专业音乐产品业务。

【来源:IT之家】
关于Stability AI,Stability Audio 3.0,音频生成模型,音乐生成,AI模型,开源模型,专业级音乐,华纳音乐集团,环球音乐集团,参数规模的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷