
摘要
近年来,设计能够处理来自不同视觉领域的图像模型的兴趣日益增长。如果在不同的视觉领域中存在一种可以通过共同参数化捕捉到的通用结构,那么我们就可以使用单一模型来处理所有领域,而无需为每个领域单独设计一个模型。此外,了解不同领域之间关系的模型还可以通过较少的资源训练以适应新领域。然而,识别模型中的可重用结构并非易事。本文提出了一种基于深度可分离卷积(Depthwise Separable Convolution)的多领域学习架构。该方法假设来自不同领域的图像在通道间具有相关性,但在空间上具有领域特定的相关性。所提出的模型紧凑且在应用于新领域时开销最小。此外,我们引入了一种门控机制以促进不同领域之间的软共享。我们在Visual Decathlon Challenge基准上评估了我们的方法,该基准用于测试多领域模型的能力。实验结果表明,我们的方法仅需当前最先进方法50%的参数即可获得最高分数。