
摘要
基于对抗训练的无监督领域适应方法在源数据集和目标数据集高度复杂或其数据分布存在较大差异时容易受到攻击。最近,一些基于Lipschitz约束的方法得到了探索。满足Lipschitz连续性的条件可以保证在目标域上的显著性能。然而,这些方法缺乏关于为什么Lipschitz约束对无监督领域适应有益的数学分析,并且通常在大规模数据集上表现不佳。本文进一步探讨了利用Lipschitz约束的原则,讨论了它如何影响无监督领域适应的误差界。建立了两者之间的联系,并展示了Lipschitz性如何降低误差界。定义了一种局部平滑差异(local smooth discrepancy)来逐点测量目标分布的Lipschitz性。在构建深度端到端模型时,为了确保无监督领域适应的有效性和稳定性,我们提出的优化策略考虑了三个关键因素,即目标域的样本数量、样本的维度和批量大小。实验结果表明,我们的模型在多个标准基准上表现出色。消融研究显示,目标域的样本数量、样本的维度和批量大小确实对基于Lipschitz约束的方法处理大规模数据集的能力产生了重大影响。代码可在https://github.com/CuthbertCai/SRDA 获取。