HyperAI超神经

OpenAI正大力押注音频AI，其战略已远超让ChatGPT语音更自然的范畴。据《信息》（The Information）报道，过去两个月，OpenAI已整合多个工程、产品与研究团队，全力升级其音频模型，为一款预计一年后发布的“以音频为中心”的个人设备做准备。这一动向标志着整个科技行业正集体转向“去屏幕化”未来。在家庭中，智能音箱已让语音助手进入超过三分之一的美国家庭；Meta推出的Ray-Ban智能眼镜搭载五麦克风阵列，可帮助用户在嘈杂环境中清晰听清对话，将人脸变成定向拾音器；谷歌则在6月试水“音频摘要”功能，将搜索结果转化为自然对话式总结；特斯拉则将Grok等大语言模型嵌入汽车系统，实现通过自然语言完成导航、空调控制等操作。这股趋势不仅限于巨头。众多初创公司也纷纷入局，尽管结果参差不齐。Humane的AI Pin曾烧光数亿美元，最终沦为“无屏可穿戴”的失败案例；Friend AI项圈则因持续记录用户生活、引发隐私与存在主义焦虑而备受争议。如今，至少有两家公司，包括由Pebble创始人Eric Migicovsky领导的团队，正开发AI智能戒指，计划于2026年发布，让使用者“对掌说话”——手部即接口。尽管形态各异，这些产品共享一个核心信念：音频是未来人机交互的主界面。从家、车，到脸，所有空间都将被转化为交互入口。OpenAI的下一代音频模型预计在2026年初发布，将具备更自然的语调、能处理打断、甚至在用户说话时同步回应，这是当前模型尚无法实现的能力。公司还构想打造一系列设备，如无屏智能音箱或智能眼镜，让设备更像“伙伴”而非工具。据《信息》报道，前苹果设计主管Jony Ive——今年5月以65亿美元收购其公司io后加入OpenAI——将音频优先设计视为纠正过去消费电子“成瘾性”的机会，强调通过更人性化、低干扰的音频交互，重塑人与技术的关系。

相关链接

相关链接

相关链接

在线教程｜不用百亿参数也能跑 Agent！Boss 直聘南北阁实验室开源 Nanbeige4.2-3B，让小模型拥有「大脑」

在线教程｜不用百亿参数也能跑 Agent！Boss 直聘南北阁实验室开源 Nanbeige4.2-3B，让小模型拥有「大脑」

Command Palette

OpenAI布局音频赛道，硅谷掀起新一轮科技争夺战

相关链接

Command Palette

OpenAI布局音频赛道，硅谷掀起新一轮科技争夺战

相关链接

Command Palette

OpenAI布局音频赛道，硅谷掀起新一轮科技争夺战

相关链接

在线教程｜不用百亿参数也能跑 Agent！Boss 直聘南北阁实验室开源 Nanbeige4.2-3B，让小模型拥有「大脑」

在线教程｜不用百亿参数也能跑 Agent！Boss 直聘南北阁实验室开源 Nanbeige4.2-3B，让小模型拥有「大脑」