6 个月前

卷积神经网络

计算机视觉

Jianlong Yuan Zelu Deng Shu Wang Zhenbo Luo

摘要

语义分割是计算机视觉中的关键任务之一，其目标是为图像中的每个像素分配一个类别标签。尽管近年来取得了显著进展，但现有大多数方法仍面临两个严峻挑战：其一，图像中物体与场景区域的尺寸差异极大，因此需要在全卷积网络（FCN）中引入多尺度特征；其二，位于物体或场景边界附近或处于边界的像素由于卷积网络固有的局限性，难以准确分类。针对第一个问题，我们提出了一种新型的多感受野模块（Multi-Receptive Field Module, MRFM），显式地融合多尺度特征。针对第二个问题，我们设计了一种边缘感知损失函数（edge-aware loss），能够有效区分物体与场景的边界区域。通过上述两项设计，所提出的多感受野网络（Multi Receptive Field Network）在两个广泛使用的语义分割基准数据集上取得了新的最先进性能。具体而言，在Cityscapes数据集上达到了83.0的平均交并比（mean IoU），在Pascal VOC2012数据集上达到了88.4的平均交并比（mean IoU）。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Jianlong Yuan Zelu Deng Shu Wang Zhenbo Luo

摘要

语义分割是计算机视觉中的关键任务之一，其目标是为图像中的每个像素分配一个类别标签。尽管近年来取得了显著进展，但现有大多数方法仍面临两个严峻挑战：其一，图像中物体与场景区域的尺寸差异极大，因此需要在全卷积网络（FCN）中引入多尺度特征；其二，位于物体或场景边界附近或处于边界的像素由于卷积网络固有的局限性，难以准确分类。针对第一个问题，我们提出了一种新型的多感受野模块（Multi-Receptive Field Module, MRFM），显式地融合多尺度特征。针对第二个问题，我们设计了一种边缘感知损失函数（edge-aware loss），能够有效区分物体与场景的边界区域。通过上述两项设计，所提出的多感受野网络（Multi Receptive Field Network）在两个广泛使用的语义分割基准数据集上取得了新的最先进性能。具体而言，在Cityscapes数据集上达到了83.0的平均交并比（mean IoU），在Pascal VOC2012数据集上达到了88.4的平均交并比（mean IoU）。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供