本文由第三方AI基于17173文章http://news.17173.com/content/05082026/100511188.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
OpenAI 最智能 AI 语音模型:GPT-Realtime-2 登场,GPT-5 级推理能力
2026-05-08 10:05:11
神评论
17173 新闻导语
OpenAI发布GPT-Realtime-2语音模型,具备GPT-5级推理能力,支持实时交互、多语言翻译和低延迟转录。了解定价和功能,构建智能语音助手!
5 月 8 日消息,OpenAI 发布三款实时语音模型,分别针对推理、翻译和转录场景,集成于 Realtime API 供开发者调用。这三款模型为实时语音应用提供底层技术支撑,目标解决语音交互中的延迟、打断处理和多语言支持难题。
GPT-Realtime-2 专为实时交互设计,是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下,能在对话过程中进行推理、调用工具,并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手,并能执行多步骤任务。

定价方面,GPT-Realtime-2 音频输入定价为每百万 Token 费用 32 美元(注:现汇率约合 218.1 元人民币),输出为 64 美元(现汇率约合 436.2 元人民币),缓存输入仅需 0.4 美元。
GPT-Realtime-Translate 支持 70 种输入语言转 13 种输出语言,翻译速度与说话者同步,适用于跨国会议或实时沟通场景。
GPT-Realtime-Whisper 则专注于低延迟流式转录,音频随说随转,让实时字幕和会议记录能跟上对话节奏,减少等待时间。翻译和转录模型按分钟计费,分别为每分钟 0.034 美元和 0.017 美元。
【来源:IT之家】
热门测试游戏
- 1《热血传奇》1.76版本最难打的BOSS,竟然可以通过卡BUG无伤击杀?
- 23A级MMORPG《时空奥德赛》公开全新成长结构等新内容
- 3《王权与自由》将于5月19日登陆俄罗斯等11个海外国家
- 4《暗黑破坏神4》十大焚诀排行榜!哪个才是最强焚诀?
- 5腾讯多文明 SLG 新作《代号:统帅》开启安卓测试招募 品类布局再添新丁
- 6AI短剧重塑《热血传奇》!你的青春记忆有被唤醒吗?
- 7《流放之路2》大型更新5月30日上线,官方:史上最大更新!
- 8网石声明《权力的游戏:国王大道》不是MMO?同时承诺不会有抽卡机制
- 9给网易倒贴才能继续做游戏的工作室有多惨!
- 10《燕云十六声》云起龙襄,流火曜野丨全新试剑、侠境即将上线

