HyperAIHyperAI

Command Palette

Search for a command to run...

OpenAI 实时语音 API 升级:GPT-5 级推理/70+语言翻译/实时转写齐登场

OpenAI 周四宣布,其 Realtime API 将新增多项语音智能功能,帮助开发者打造能听、能说、能翻译、能转写的应用程序。 核心产品包括三款新模型。GPT-Realtime-2 基于 GPT-5 级推理能力,可处理更复杂的用户指令,实现更自然的语音对话;GPT-Realtime-Translate 支持实时翻译,覆盖70多种输入语言和13种输出语言,对话过程中即时切换;GPT-Realtime-Whisper 则提供实时语音转文字能力,在对话发生的同时完成转写。 OpenAI 表示,这些新模型正推动实时音频技术从简单的"问答式"交互,迈向能真正"听、推理、翻译、转写并执行操作"的语音界面。目标应用涵盖客户服务、教育、媒体、活动及创作者平台等多个领域。 针对潜在滥用风险,OpenAI 称已内置护栏机制,当对话检测到违反有害内容指南时,系统可自动中断。 定价方面,Translate 和 Whisper 按分钟计费,GPT-Realtime-2 按 Token 消耗计费,均已纳入 Realtime API。

相关链接

OpenAI 实时语音 API 升级:GPT-5 级推理/70+语言翻译/实时转写齐登场 | 热门资讯 | HyperAI超神经