6 个月前

摘要

基于深度神经网络（DNN）的语义分割模型在源域上训练后，通常难以泛化至未见的目标域，即存在域间差异（domain gap）问题。纹理特征往往是导致域差异的重要因素，使得DNN模型在面对域迁移时表现脆弱，因其容易产生对纹理的偏好（texture bias）。现有的领域泛化语义分割（Domain Generalized Semantic Segmentation, DGSS）方法通过引导模型优先关注形状而非纹理，已在一定程度上缓解了域差异问题。然而，形状与纹理是语义分割中两种显著且互补的视觉线索。本文认为，在DGSS任务中有效利用纹理信息对于提升模型性能至关重要。为此，本文提出一种新颖的框架——纹理学习域随机化（Texture Learning Domain Randomization, TLDR）。TLDR引入两种新型损失函数，以有效增强DGSS中纹理特征的学习能力：（1）纹理正则化损失（texture regularization loss），通过引入在ImageNet上预训练模型提取的纹理特征，防止模型过度拟合源域的纹理；（2）纹理泛化损失（texture generalization loss），利用随机风格图像在自监督学习框架下学习多样化纹理表征。大量实验结果表明，所提出的TLDR框架具有显著优势。例如，在GTA5到Cityscapes的跨域迁移任务中，基于ResNet-50的TLDR模型取得了46.5 mIoU的性能，较现有最先进方法提升了1.9 mIoU。相关源代码已开源，地址为：https://github.com/ssssshwan/TLDR。

源 PDF 查看代码