Command Palette
Search for a command to run...
Decomposed Forward Pass(DePass)
Decomposed Forward Pass(DePass)是由清华大学、上海人工智能实验室于 2025 年 11 月提出的,相关研究成果发表于论文「DePass: Unified Feature Attributing by Simple Decomposed Forward Pass」,入选 NeurIPS 2025 。
DAVSP 是一个基于单一分解前向传递的统一特征归属框架,它将每个隐态分解为加法分量,将这些分量传播到剩余的层级,然后获得每个分量对目标表示的精确贡献。在分解后的前向传递中,注意力分数和 MLP 激活被固定,并根据分解后的成分分配加权贡献。与其他方法相比,DePass 在不同粒度层级上实现了更忠实的归属。