7 个月前

卷积神经网络

计算机视觉

Rudra PK Poudel Stephan Liwicki Roberto Cipolla

摘要

编码器-解码器框架在离线语义图像分割领域处于领先地位。随着自主系统的兴起，实时计算变得越来越重要。本文介绍了一种快速分割卷积神经网络（Fast-SCNN），该模型能够在高分辨率图像数据（1024x2048像素）上实现超过实时的语义分割，并适用于低内存嵌入式设备上的高效计算。基于现有的双分支快速分割方法，我们引入了“学习降采样”模块，该模块能够同时为多个分辨率分支计算低级特征。我们的网络结合了高分辨率下的空间细节和低分辨率下提取的深层特征，从而在Cityscapes数据集上实现了每秒123.5帧、平均交并比为68.0%的性能。我们还证明了大规模预训练并非必要。通过使用ImageNet预训练和Cityscapes粗标签数据进行实验，我们对这一结论进行了充分验证。最后，我们在不修改网络结构的情况下，展示了在子采样输入上实现更快计算且具有竞争力的结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

计算机视觉

Rudra PK Poudel Stephan Liwicki Roberto Cipolla

摘要

编码器-解码器框架在离线语义图像分割领域处于领先地位。随着自主系统的兴起，实时计算变得越来越重要。本文介绍了一种快速分割卷积神经网络（Fast-SCNN），该模型能够在高分辨率图像数据（1024x2048像素）上实现超过实时的语义分割，并适用于低内存嵌入式设备上的高效计算。基于现有的双分支快速分割方法，我们引入了“学习降采样”模块，该模块能够同时为多个分辨率分支计算低级特征。我们的网络结合了高分辨率下的空间细节和低分辨率下提取的深层特征，从而在Cityscapes数据集上实现了每秒123.5帧、平均交并比为68.0%的性能。我们还证明了大规模预训练并非必要。通过使用ImageNet预训练和Cityscapes粗标签数据进行实验，我们对这一结论进行了充分验证。最后，我们在不修改网络结构的情况下，展示了在子采样输入上实现更快计算且具有竞争力的结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供