HyperAIHyperAI

Command Palette

Search for a command to run...

OpenAI布局音频赛道,硅谷掀起新一轮科技争夺战

OpenAI正大力押注音频AI,其战略已远超让ChatGPT语音更自然的范畴。据《信息》(The Information)报道,过去两个月,OpenAI已整合多个工程、产品与研究团队,全力升级其音频模型,为一款预计一年后发布的“以音频为中心”的个人设备做准备。 这一动向标志着整个科技行业正集体转向“去屏幕化”未来。在家庭中,智能音箱已让语音助手进入超过三分之一的美国家庭;Meta推出的Ray-Ban智能眼镜搭载五麦克风阵列,可帮助用户在嘈杂环境中清晰听清对话,将人脸变成定向拾音器;谷歌则在6月试水“音频摘要”功能,将搜索结果转化为自然对话式总结;特斯拉则将Grok等大语言模型嵌入汽车系统,实现通过自然语言完成导航、空调控制等操作。 这股趋势不仅限于巨头。众多初创公司也纷纷入局,尽管结果参差不齐。Humane的AI Pin曾烧光数亿美元,最终沦为“无屏可穿戴”的失败案例;Friend AI项圈则因持续记录用户生活、引发隐私与存在主义焦虑而备受争议。如今,至少有两家公司,包括由Pebble创始人Eric Migicovsky领导的团队,正开发AI智能戒指,计划于2026年发布,让使用者“对掌说话”——手部即接口。 尽管形态各异,这些产品共享一个核心信念:音频是未来人机交互的主界面。从家、车,到脸,所有空间都将被转化为交互入口。OpenAI的下一代音频模型预计在2026年初发布,将具备更自然的语调、能处理打断、甚至在用户说话时同步回应,这是当前模型尚无法实现的能力。公司还构想打造一系列设备,如无屏智能音箱或智能眼镜,让设备更像“伙伴”而非工具。 据《信息》报道,前苹果设计主管Jony Ive——今年5月以65亿美元收购其公司io后加入OpenAI——将音频优先设计视为纠正过去消费电子“成瘾性”的机会,强调通过更人性化、低干扰的音频交互,重塑人与技术的关系。

相关链接