OpenAI为API推出全新语音智能功能
#大模型动态 时间2026-05-08 11:08:19

5月7日,OpenAI宣布为其Realtime API新增多项语音智能功能,帮助开发者构建能对话、转录和实时翻译的应用程序。
核心升级包括:
· GPT-Realtime-2:新一代语音模型,具备GPT-5级推理能力,可处理更复杂的用户请求,实现更自然的语音交互。
· GPT-Realtime-Translate:支持70+种输入语言和13种输出语言的实时对话翻译,保持自然语速。
· GPT-Realtime-Whisper:实时语音转文字功能,可捕捉并转录对话内容。
OpenAI表示,这些模型将语音交互从简单问答升级为“能真正完成工作”的界面:倾听、推理、翻译、转录并采取行动。适用场景包括客户服务、教育、媒体、活动及创作者平台等。
为防止滥用,公司内置了防护机制,可在检测到违规内容时中断对话。新功能按使用量计费(翻译和转录按分钟,GPT-Realtime-2按token)。
评论
0 条登录后才可以发表评论。
立即登录