HyperAIHyperAI

Command Palette

Search for a command to run...

5 小时前
语音生成
LLM

Hugging Face与Cerebras将Gemma 4引入实时语音AI

近日,人工智能平台Hugging Face与计算芯片企业Cerebras宣布达成技术合作,联合发布基于Gemma 4模型的实时语音交互解决方案,致力于攻克语音AI领域的响应延迟难题。该架构采用全开源、可插拔的语音到语音设计,深度融合英伟达Parakeet自动语音识别、谷歌DeepMind Gemma 4 31B视觉语言模型,以及阿里巴巴Qwen3TTS语音合成技术。借助Cerebras超大规模推理芯片的算力优势,系统显著压缩了模型处理耗时,有效化解了传统系统P95分位长尾延迟痛点,使机器回复具备媲美人类对话的自然流畅度。目前,该实时语音管线已投入Reachy Mini机器人集群运行,全球在网设备突破九千台。在具身智能与虚拟助手机器人领域,极低的延迟与稳定的性能并非体验优化,而是实现拟人化交互的基础条件。此次联合演示验证了开源生态、定制化硬件与高速推理架构协同发展的可行性。相关代码库与交互演示已向开发者全面开放,旨在推动下一代高并发、低延迟的实时语音AI应用落地。

相关链接