HyperAI超神经

分布外泛化 Out-of-Distribution Generalization

分布外泛化(Out-of-Distribution Generalization,简称 OOD 泛化)旨在解决模型在训练数据分布与测试数据分布不一致时的泛化能力问题,它关注的是如何让模型在面对未知或未见过的数据分布时,仍然能够保持良好的性能和稳定性。

在传统的机器学习任务中,通常假设训练数据和测试数据来自相同的分布(独立同分布,i.i.d.)。然而,在现实世界的应用中,这种假设往往不成立。例如,训练数据可能来自特定的环境或条件,而测试数据可能来自完全不同的环境。这种分布上的差异会导致模型在测试数据上的性能显著下降。分布外泛化的目标就是解决这种分布偏移 (distribution shift) 问题,使模型能够适应和泛化到未见过的数据分布。