MIT präsentiert lautlose AI-Kommunikation mit AlterEgo
麻省理工学院(MIT)近日推出名为AlterEgo的非侵入式可穿戴AI设备,实现无需发声的无声人机交互。该设备通过捕捉用户在心中默念时产生的微弱神经肌肉信号,将内在语言转化为可识别的指令。其核心原理在于,当人默念话语时,大脑会向喉部及面部肌肉发送神经信号,引发可检测的肌电信号。AlterEgo配备多个精密电极,分布在面部与颈部关键区域,采用金镀银电极与导电膏提升信号采集质量。为确保信号纯净,系统运用偏置信号抵消技术消除交流电干扰,并结合巴特沃斯滤波器去除高频噪声,最终提取出梅尔频率倒谱系数(MFCC)特征。这些特征经由卷积神经网络(CNN)进行分类处理,实现对无声言语的识别,准确率高达92%。识别结果通过骨传导耳机实时反馈,形成双向无声交互闭环。 AlterEgo的形态类似传统耳机,佩戴舒适,不影响日常活动。其应用场景广泛,用户可在不发出声音的情况下完成数字输入、数学运算、智能家居控制等操作,尤其适用于需要安静环境的场景,如图书馆、会议室或手术室。对于失语症患者、喉部手术后患者或患有肌萎缩侧索硬化症(ALS)等言语障碍人群,AlterEgo提供了一种全新的表达方式——只需在心中默念,设备即可帮助其“说出”想要表达的内容,极大提升沟通自由度与生活质量。 这项技术标志着人机交互从语音控制迈向“思维—设备”直接连接的重要一步。相比传统语音助手依赖外部声音输入,AlterEgo突破了物理发声的限制,实现更私密、更高效的交互体验。尽管目前仍需在特定环境下使用,且对个体信号差异有一定适应要求,但其技术路径已为未来脑机接口(BCI)的发展提供了坚实基础。 业内专家认为,AlterEgo代表了下一代人机交互的前沿方向,其非侵入性与高识别率使其具备商业化潜力。MIT团队已通过官网alterego.io展示项目进展,并计划推进临床测试与产品迭代。未来若能与更先进的AI模型结合,或实现多语言、连续语句识别,有望在医疗、军事、教育等领域广泛应用。该设备虽尚未上市,但其技术理念已引发科技界广泛关注,预示着“无声沟通”正从实验室走向现实。
