7 个月前

卷积神经网络

计算机视觉

Tobias Pohlen Alexander Hermans Markus Mathias Bastian Leibe

摘要

语义图像分割是现代自动驾驶系统中的一个重要组成部分，因为对周围场景的准确理解对于导航和行动规划至关重要。当前最先进的语义图像分割方法依赖于最初为整体图像分类而开发的预训练网络。尽管这些网络在识别性能（即可见物体是什么）方面表现出色，但在定位精度（即物体具体位于何处）方面却有所欠缺。因此，为了获得全分辨率图像的像素级精确分割掩模，需要进行额外的处理步骤。为了解决这一问题，我们提出了一种新型的类似ResNet的架构，该架构在定位和识别性能方面表现出色。通过在网络中使用两个处理流，我们将多尺度上下文与像素级精度相结合：一个流携带全分辨率图像的信息，从而实现对分割边界的精确遵循；另一个流经过一系列池化操作以获取稳健的识别特征。这两个流在全分辨率下通过残差连接进行耦合。无需额外的处理步骤且无需预训练，我们的方法在Cityscapes数据集上达到了71.8%的交并比分数。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

计算机视觉

Tobias Pohlen Alexander Hermans Markus Mathias Bastian Leibe

摘要

语义图像分割是现代自动驾驶系统中的一个重要组成部分，因为对周围场景的准确理解对于导航和行动规划至关重要。当前最先进的语义图像分割方法依赖于最初为整体图像分类而开发的预训练网络。尽管这些网络在识别性能（即可见物体是什么）方面表现出色，但在定位精度（即物体具体位于何处）方面却有所欠缺。因此，为了获得全分辨率图像的像素级精确分割掩模，需要进行额外的处理步骤。为了解决这一问题，我们提出了一种新型的类似ResNet的架构，该架构在定位和识别性能方面表现出色。通过在网络中使用两个处理流，我们将多尺度上下文与像素级精度相结合：一个流携带全分辨率图像的信息，从而实现对分割边界的精确遵循；另一个流经过一系列池化操作以获取稳健的识别特征。这两个流在全分辨率下通过残差连接进行耦合。无需额外的处理步骤且无需预训练，我们的方法在Cityscapes数据集上达到了71.8%的交并比分数。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供