简体中文
关闭
AI新闻中心

OpenAI为API推出全新语音智能功能

#大模型动态 时间2026-05-08 11:08:19


57日,OpenAI宣布为其Realtime API新增多项语音智能功能,帮助开发者构建能对话、转录和实时翻译的应用程序。

核心升级包括:

· GPT-Realtime-2:新一代语音模型,具备GPT-5级推理能力,可处理更复杂的用户请求,实现更自然的语音交互。

· GPT-Realtime-Translate:支持70+种输入语言和13种输出语言的实时对话翻译,保持自然语速。

· GPT-Realtime-Whisper:实时语音转文字功能,可捕捉并转录对话内容。

OpenAI表示,这些模型将语音交互从简单问答升级为能真正完成工作的界面:倾听、推理、翻译、转录并采取行动。适用场景包括客户服务、教育、媒体、活动及创作者平台等。

为防止滥用,公司内置了防护机制,可在检测到违规内容时中断对话。新功能按使用量计费(翻译和转录按分钟,GPT-Realtime-2token)。

相关标签:

分享本文
OpenAI为API推出全新语音智能功能

OpenAI为API推出全新语音智能功能

5月7日,OpenAI宣布为其Realtime API新增多项语音智能功能,帮助开发者构建能对话、转录和实时翻译的应用程序。核心升级包括:· GPT-Realtime-2:新一代语音模型,具备...

评论

0 条
暂无评论,快来抢沙发。

Copyright © 2026 IAICA 版权所有  隐私政策 用户协议 Cookie说明 备案号:沪ICP备11018632号-8

18351659883