Command Palette
Search for a command to run...
标记感知编辑 TAE
标记感知编辑(Token-Aware Editing,TAE)是由北京航空航天大学研究团队于 2025 年 5 月提出的,相关研究成果发表于论文为「Token-Aware Editing of Internal Activations for Large Language Model Alignment」。
TAE 能够充分利用激活空间中的标记级对齐信息,从而实现更优的干预后性能。具体而言,互信息引导图聚合(Mutual Information-guided Graph Aggregation,MIG)模块首先构建一个互信息引导图,以利用标记的信息交互进行激活增强,从而提高对齐探测并促进干预。随后,错位感知自适应干预(Misalignment-aware Adaptive Intervention,MAI)从标记表示和预测中全面感知标记级错位程度,以指导编辑强度的自适应调整,从而提高最终对齐性能。