新游热游: 全球国内手游盘点测试表开服表怀旧频道

品牌: 游戏X博士正惊游戏公众号

新闻大全

17173 > 游戏资讯 > 科技新闻 > 正文

OpenAI 最智能 AI 语音模型：GPT-Realtime-2 登场，GPT-5 级推理能力

2026-05-08 10:05:11 神评论

17173 新闻导语

OpenAI发布GPT-Realtime-2语音模型，具备GPT-5级推理能力，支持实时交互、多语言翻译和低延迟转录。了解定价和功能，构建智能语音助手！

5 月 8 日消息，OpenAI 发布三款实时语音模型，分别针对推理、翻译和转录场景，集成于 Realtime API 供开发者调用。这三款模型为实时语音应用提供底层技术支撑，目标解决语音交互中的延迟、打断处理和多语言支持难题。

GPT-Realtime-2 专为实时交互设计，是首款具备 GPT-5 级推理能力的语音模型。它在保持对话自然流畅的前提下，能在对话过程中进行推理、调用工具，并处理用户的打断或纠正。这意味着开发者可以构建更复杂的语音助手，并能执行多步骤任务。

定价方面，GPT-Realtime-2 音频输入定价为每百万 Token 费用 32 美元（注：现汇率约合 218.1 元人民币），输出为 64 美元（现汇率约合 436.2 元人民币），缓存输入仅需 0.4 美元。

GPT-Realtime-Translate 支持 70 种输入语言转 13 种输出语言，翻译速度与说话者同步，适用于跨国会议或实时沟通场景。

GPT-Realtime-Whisper 则专注于低延迟流式转录，音频随说随转，让实时字幕和会议记录能跟上对话节奏，减少等待时间。翻译和转录模型按分钟计费，分别为每分钟 0.034 美元和 0.017 美元。

【来源：IT之家】

关于OpenAI,GPT-Realtime-2,语音模型,实时语音,推理能力,GPT-5,翻译,转录,Realtime API,定价的新闻

今日热点

告别屠龙主线！《激战3》重磅爆料全文翻译+解析！

《古剑》41分钟实机演示首曝《终末地》云游戏不限量测试

又一款MMO端游大作来袭《永恒之塔2》国服发布会预告

《魔兽世界》国服整治公告《魔兽世界》TBC周年大更：双经典团本回归！

热门测试游戏

热门新闻排行

Wan网页游戏**玩