2 个月前

用于单领域泛化的元卷积神经网络

{Xian-Sheng Hua, Jianqiang Huang, Feng Gao, Xinmei Tian, Zhiheng Yin, Yonggang Zhang, Xu Shen, Chaoqun Wan}
用于单领域泛化的元卷积神经网络
摘要

在单域泛化(single domain generalization)任务中,模型仅使用单一领域数据进行训练,却需在多个未见领域上保持良好性能。本文提出一种新型模型——元卷积神经网络(meta convolutional neural network),以解决图像识别中的单域泛化问题。其核心思想是将图像的卷积特征分解为元特征(meta features)。这些元特征作为“视觉词汇”,被定义为图像表示中的通用且基本的视觉单元(类似于自然语言中文档的“词汇”)。基于元特征作为参考,本文提出一种组合操作,通过寻址机制剔除局部卷积特征中的无关信息,并将卷积特征图重新构造成相关元特征的组合形式。由此,图像得以在不引入未见领域偏见信息的前提下实现通用编码,从而可由在源域上训练好的后续模块进行处理。该组合操作采用回归分析技术,以在线小批量学习(online batch learning)的方式持续学习元特征。在多个基准数据集上的大量实验验证了所提模型在提升单域泛化能力方面的优越性。