HyperAIHyperAI

Command Palette

Search for a command to run...

Meta AI眼镜实时翻译黑科技揭秘:如何让世界“听懂”你的话

Meta的AI眼镜推出实时翻译功能,正逐步将科幻中的“通用翻译器”变为现实。这一功能在Connect 2024大会上首次亮相,引发广泛关注。如今,该功能已覆盖Ray-Ban Meta、Oakley Meta Vanguard和HSTN等多款AI眼镜,支持英语、法语、德语、意大利语、葡萄牙语和西班牙语,而Meta Ray-Ban Display则支持英语、法语、意大利语和西班牙语。 这项技术的诞生源于一个原型设想:最初仅为未发布的新款Meta Ray-Ban Display设计的演示功能。但团队很快发现,已在市场上的Ray-Ban Meta凭借其五麦克风阵列和波束成形技术,能精准区分说话人与对话者,极大提升翻译准确性。更关键的是,系统无需依赖屏幕显示,而是通过眼镜的开放式扬声器实时播放翻译后的语音,实现“听懂即回应”的自然交互。 整个过程在设备端完成:语音转文字、翻译、再转为语音,全程仅用2.7秒,较初期的5秒以上大幅优化。这得益于团队在模型压缩、内存管理与低延迟处理上的突破,尤其是实现了“流式处理”——模型能在几句话内完成理解、翻译与语音生成,无需等待整句输入。 设计过程中,团队始终以用户为中心。考虑到旅行中网络不稳定的情况,功能支持离线使用,用户可提前下载语言包。由于所有计算都在本地完成,缺乏云端日志,团队只能通过持续测试来优化质量,过程充满挑战。 目前功能仍在迭代中,延迟与准确率仍有提升空间。每新增一种语言,都需要针对特定设备重新训练和验证模型,因此扩展速度受限。但团队目标明确:让全球任何人在任何地方都能即时理解任何语言。 早期测试已显成效:人们用它与家人沟通、在异国旅行中理解导览讲解、在国际会议中顺畅交流。其自然的开放式音频设计,避免了传统耳机带来的隔绝感,让人更专注于当下对话。 团队成员坦言,这不仅是技术突破,更是信念的凝聚。许多成员母语非英语,深刻理解语言障碍之痛。他们希望未来能让祖辈的言语不再被语言隔阂阻挡,让跨代、跨文化沟通真正畅通无阻。 Meta正持续投入,推动更多语言上线。实时翻译虽处起步阶段,但已迈出关键一步——让世界更紧密相连,让每一次对话都更有温度。

相关链接