17 天前

用于语义分割的多感受野网络

Jianlong Yuan, Zelu Deng, Shu Wang, Zhenbo Luo
用于语义分割的多感受野网络
摘要

语义分割是计算机视觉中的关键任务之一,其目标是为图像中的每个像素分配一个类别标签。尽管近年来取得了显著进展,但现有大多数方法仍面临两个严峻挑战:其一,图像中物体与场景区域的尺寸差异极大,因此需要在全卷积网络(FCN)中引入多尺度特征;其二,位于物体或场景边界附近或处于边界的像素由于卷积网络固有的局限性,难以准确分类。针对第一个问题,我们提出了一种新型的多感受野模块(Multi-Receptive Field Module, MRFM),显式地融合多尺度特征。针对第二个问题,我们设计了一种边缘感知损失函数(edge-aware loss),能够有效区分物体与场景的边界区域。通过上述两项设计,所提出的多感受野网络(Multi Receptive Field Network)在两个广泛使用的语义分割基准数据集上取得了新的最先进性能。具体而言,在Cityscapes数据集上达到了83.0的平均交并比(mean IoU),在Pascal VOC2012数据集上达到了88.4的平均交并比(mean IoU)。