消息称 OpenAI 正开发双向语音模型:对话被打断照样跟你继续聊,体验“更像人”
OpenAI开发双向语音模型BiDi,实现自然对话打断与实时回应,提升AI语音交互体验,预计第二季度发布。
3 月 5 日消息,今天晚间,据 The Information 报道,OpenAI 正在开发一种新的语音模型,希望让用户与 ChatGPT 的对话更加自然。当用户在 AI 说话过程中打断系统时,AI 可以实时调整回应,而不是像现在一样突然停止。
目前 ChatGPT 的高级语音模式采用回合式对话机制。用户必须先说完话,AI 才会处理语音并生成回答。如果用户在 AI 发言时插入“okay”或“mm-hm”等回应,系统通常会直接停止,而不会继续像正常对话那样进行。
OpenAI 正在开发的新模型名为 BiDi(注:双向语音模型)。该模型能够持续处理说话者的语音输入,因此在被打断时可以立即调整回应。相比之下,现有语音模型一旦开始生成回答,输出内容就基本固定,无法再根据新的输入进行变化。
这项技术仍处于开发阶段。一名了解项目情况的人士表示,原型模型在持续对话几分钟后容易出现故障,有时甚至会发出不自然的声音。OpenAI 研究人员原本希望今年第一季度发布 BiDi,而目前最新的发布时间可能推迟到第二季度或更晚。
OpenAI 认为,如果语音模型能够在性能上接近文本模型,AI 的使用范围将进一步扩大,因为大多数人更习惯与 AI 进行语音交流,而不是输入文字。
BiDi 模型在客服场景中可能尤其有价值。例如,当顾客与零售商的 AI 客服通话时,如果顾客在对话过程中临时决定选择换货而非退货,BiDi 模型理论上可以让 AI 客服顺畅调整对话,而不会突然停止或出现混乱。
这名知情人士还表示,BiDi 模型在调用外部工具和应用方面也更灵活。据了解,OpenAI 此前表示,公司计划为未来一款主要通过语音交互的 AI 设备改进语音模型,并考虑开发一款智能音箱,通过语音指令即可查看邮件或预订服务。
- OpenAI最强模型GPT-5.4重磅发布 首次支持原生操控电脑 超越人类 2026-03-06
- OpenAI GPT-5.4 正式登场:原生支持计算机操作,编码能力超前代,专业知识工作表现接近人类专家 2026-03-06
- IT早报 0306:2026 胡润全球富豪榜出炉;比亚迪二代刀片电池与单枪 1500kW 闪充桩发布;阿里辟谣千问团队集体离职;OpenAI GPT-5.4 登场... 2026-03-06
- 消息称 Anthropic 重启与美国国防部谈判,OpenAI“抢单”局面生变 2026-03-06
- 普通程序员要失业了!Codex登陆Windows系统:小白也能一句话编程 2026-03-05
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 一看吓一跳:雷死人不偿命的囧图集(1033)
- 3月新游推荐:韩游最重磅的3A《红色沙漠》即将发售!《失落星船:马拉松》能否蹭上搜打撤的热度?
- 一看吓一跳:雷死人不偿命的囧图集(1035)
- 一看吓一跳:雷死人不偿命的囧图集(1036)
- 一看吓一跳:雷死人不偿命的囧图集(1034)
- 正惊GIF:人神共愤!如此漂亮女教师被气到动手,学生竟一脸无所谓
- 热游情报:宝可梦、守望、古印度黑猴新作曝光!首款二次元GTA抢先定档
- 颜值COS,玉足、白丝过膝袜,体操服双马尾,简直太迷人
- 2月多款重磅新游测试:腾讯网易完美新作齐发、经典韩国MMO新作
- 《蔚蓝档案》「白丝透肤VS发光腹肌!砂狼白子体操服侧拍,腰线凹陷度堪比3D建模」
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 《燕云十六声》掌中宝+特殊蹊跷位置大全,三寸之身任务合集,仅剩7天10连抽连袅袅之音!
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 「纯欲天花板」2B花嫁撕破次元!白丝过膝陷肉感,透粉脚底VS发光蛮腰の双重暴击
- 《传奇5》真的要来了?还有《绝地求生》衍生作上线!盘点2026年能够玩到的韩国游戏
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 和平精英2025灵敏度分享码:最稳压枪灵敏度方案推荐
- AI大姐姐:胸猛美女,挑战你的视觉极限(221)
- 一看吓一跳:雷死人不偿命的囧图集(1033)

