
摘要
在领域泛化(Domain Generalization)的研究文献中,一个常见的目标是在给定类别标签的条件下学习与领域无关的表示。我们证明了这一目标并不充分:存在反例表明,即使满足了类条件下的领域不变性,模型仍然无法泛化到未见过的领域。我们通过结构因果模型对这一观察进行了形式化,并展示了建模类内变化对于泛化的重要性。具体而言,每个类别包含表征特定因果特征的对象,而领域可以被解释为对这些对象进行干预,从而改变非因果特征。我们强调了一个替代条件:如果输入来自同一对象,则它们在不同领域的表示应该是相同的。基于这一目标,当基础对象可观察时(例如,通过数据增强),我们提出了匹配算法;当对象不可观察时,我们则近似实现该目标(MatchDG)。我们的简单匹配算法在旋转MNIST、Fashion-MNIST、PACS和胸部X光数据集上的域外准确性方面与先前的工作具有竞争力。此外,我们的方法MatchDG还能够恢复真实的对象匹配:在MNIST和Fashion-MNIST数据集中,MatchDG生成的前10个匹配中有超过50%与真实匹配重叠。