
摘要
DeepLab 是一种广泛应用于语义分割的深度神经网络,其成功归功于其并行架构——空洞空间金字塔池化(Atrous Spatial Pyramid Pooling, ASPP)。ASPP 通过使用不同空洞率的多个空洞卷积来提取局部和全局信息。然而,ASPP 模块中使用的空洞率值是固定的,这限制了其感受野的大小。原则上,空洞率应该是一个超参数,可以根据目标任务或数据集调整感受野的大小。然而,目前尚无任何指南来指导空洞率的调整。本研究提出了获取最优空洞率的实际指南。首先,引入了一个有效的感受野概念用于分析语义分割网络的内部行为。我们观察到,使用 ASPP 模块后,有效感受野呈现出特定的模式,这一模式被追踪以揭示模块的底层机制。据此,我们推导出实际指南,以根据输入图像的大小控制最优空洞率。与其他值相比,使用最优空洞率在多个数据集上(包括 STARE、CHASE_DB1、HRF、Cityscapes 和 iSAID 数据集)持续改善了分割结果。