
摘要
与人类学习不同,机器学习在处理训练(源)数据和测试(目标)数据分布之间的变化时常常失败。这种域偏移在实际场景中十分常见,严重损害了传统机器学习方法的性能。针对目标数据有标签的情况,已经提出了一些监督域适应方法,其中一些尽管实现起来“令人沮丧地简单”,但表现非常出色。然而,在实践中,目标域通常没有标签,需要进行无监督适应。我们提出了一种简单、有效且高效的无监督域适应方法,称为相关对齐(CORrelation ALignment, CORAL)。CORAL 通过对齐源分布和目标分布的二阶统计量来最小化域偏移,而无需任何目标标签。尽管该方法极其简单——只需四行 Matlab 代码即可实现——但在标准基准数据集上的广泛评估中,CORAL 的表现却非常出色。