OpenAI为API推出全新语音智能功能_大模型动态

AI新闻中心

首页 AI新闻中心大模型动态

#大模型动态时间2026-05-08 11:08:19

5月7日，OpenAI宣布为其Realtime API新增多项语音智能功能，帮助开发者构建能对话、转录和实时翻译的应用程序。

核心升级包括：

· GPT-Realtime-2：新一代语音模型，具备GPT-5级推理能力，可处理更复杂的用户请求，实现更自然的语音交互。

· GPT-Realtime-Translate：支持70+种输入语言和13种输出语言的实时对话翻译，保持自然语速。

· GPT-Realtime-Whisper：实时语音转文字功能，可捕捉并转录对话内容。

OpenAI表示，这些模型将语音交互从简单问答升级为“能真正完成工作”的界面：倾听、推理、翻译、转录并采取行动。适用场景包括客户服务、教育、媒体、活动及创作者平台等。

为防止滥用，公司内置了防护机制，可在检测到违规内容时中断对话。新功能按使用量计费（翻译和转录按分钟，GPT-Realtime-2按token）。