17173 > 游戏资讯 > 科技新闻 > 正文

Mistral AI 发布 Voxtral Transcribe 2 系列语音转文字模型,其一延迟不足 0.2s

2026-02-05 16:02:24 神评论
17173 新闻导语

Mistral AI发布Voxtral Transcribe 2系列语音转文字模型!延迟低于0.2秒,支持中文等13种语言,性价比超越GPT-4o与Gemini。立即了解详情!

2 月 5 日消息,Mistral AI 当地时间昨日发布两款 Voxtral Transcribe 2 系列模型,包括面向批量处理的 Voxtral Mini Transcribe V2 和用于实时转录的 Voxtral Realtime,其中后者以 Apache 2.0 许可开放权重形式公开。

Voxtral Realtime 参数规模为 4B,专为对延迟要求严格的应用场景而设计,其采用了一种全新的流式架构,可在音频到达时立即进行转录,能将转录延迟压缩至 200ms 以下。

另一方面,Voxtral Mini Transcribe V2 拥有目前性价比最高的转录 API,准确率表现优于 GPT-4o mini Transcribe、Gemini 2.5 Flash,单次请求可处理长达 3 小时的录音。

这两款模型均支持包含中文在内的 13 种语言。定价上,Voxtral Mini Transcribe V2 的 API 价格为每分钟 0.003 美元,Voxtral Realtime 则为每分钟 0.006 美元。

【来源:IT之家】
关于Mistral AI,Voxtral Transcribe 2,Voxtral Realtime,Voxtral Mini Transcribe V2,语音转文字,实时转录,低延迟,API,多语言支持,Apache 2.0的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷