
摘要
宽残差网络(Wide-Residual Networks, Wide-ResNets)是残差网络(Residual Networks, ResNets)的一种浅层但宽结构的变体,通过堆叠少量具有较大通道数的残差块实现,在多个密集预测任务中展现出卓越的性能。然而,自提出以来,Wide-ResNet架构在近年来几乎未发生显著演进。在本研究中,我们针对近期极具挑战性的全景分割(panoptic segmentation)任务,重新审视了该架构的设计。全景分割旨在统一语义分割与实例分割任务。我们通过在Wide-ResNets中引入简单而高效的挤压-激励模块(Squeeze-and-Excitation)与可切换空洞卷积(Switchable Atrous Convolution),构建了一个基准模型。随后,通过调整网络的宽度(即通道数)和深度(即层数),进一步扩展或压缩模型容量,从而形成一系列名为SWideRNets(Scaling Wide Residual Networks的缩写)的模型家族。实验表明,这种简洁的缩放策略结合网格搜索,能够有效发现多个SWideRNets模型,在快速模型与强模型两种范式下,均显著提升了全景分割任务在多个数据集上的最先进性能。