EPFL研发脑启发模块化语言模型,破解AI黑盒难题
近日,瑞士洛桑联邦理工学院研究团队发布了一款名为MiCRo的类脑模块化大语言模型,相关成果已投稿至arXiv并在ICLR 2026会议上展示。该模型由该校NLP实验室与NeuroAI实验室联合研发,博士生Badr AlKhamissi担任负责人,并获哈佛大学与麻省理工学院神经科学家Greta Tuckute学术指导。传统大语言模型通常以黑盒形式运作,内部决策路径难以追溯。MiCRo突破了这一局限,在架构上模拟人脑功能分区,划分为语言、逻辑、社会推理与世界知识四个独立专家模块。其核心动态路由机制可根据文本语义,在每一处理层将不同词汇精准分配至对应模块进行并行运算。例如在解析复杂社交与计算交织的指令时,模型会自动将算术部分交由逻辑模块处理,将情感隐含意义交由社会推理模块解析。该设计大幅提升了决策可解释性,允许研究人员通过底层架构直接调节各模块权重,彻底摆脱对传统提示词工程的依赖。研究成功构建了人工智能与认知神经科学的良性互动闭环:既以脑科学理论优化AI架构,亦借助模型运行数据反哺神经机制探索。此项突破为下一代透明可控的人工智能发展确立了新范式。
