6 个月前

卷积神经网络

计算机视觉

Xiangtai Li Li Zhang Ansheng You Maoke Yang Kuiyuan Yang Yunhai Tong

摘要

大量研究表明，在全卷积网络（FCNs）中通过全局聚合模块建模长程依赖关系，对于语义分割、目标检测等复杂场景理解任务至关重要。然而，传统的全局聚合机制往往过度依赖大尺度模式的特征，导致包含小尺度模式（如边界和小物体）的区域出现过度平滑的问题。为解决这一问题，本文提出一种新型模块——GALD（Global Aggregation and Local Distribution），其核心思想是先进行全局聚合，再进行局部分布建模。该设计使得长程依赖关系在大尺度模式区域中得到更可靠的利用，而在小尺度模式区域中则更侧重局部细节的保留。网络在每个位置通过通道级掩码图（per-channel mask map）动态估计不同模式的尺寸。GALD模块可端到端训练，且能够无缝集成到各类现有FCN架构中，适配多种全局聚合模块，适用于广泛的视觉任务。实验表明，GALD在多个前沿目标检测与实例分割方法上均能一致提升性能。尤其在语义分割任务中，GALD在Cityscapes测试集上取得了83.3%的mIoU，刷新了当前最优结果。代码已开源，地址为：https://github.com/lxtGH/GALD-Net。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Xiangtai Li Li Zhang Ansheng You Maoke Yang Kuiyuan Yang Yunhai Tong

摘要

大量研究表明，在全卷积网络（FCNs）中通过全局聚合模块建模长程依赖关系，对于语义分割、目标检测等复杂场景理解任务至关重要。然而，传统的全局聚合机制往往过度依赖大尺度模式的特征，导致包含小尺度模式（如边界和小物体）的区域出现过度平滑的问题。为解决这一问题，本文提出一种新型模块——GALD（Global Aggregation and Local Distribution），其核心思想是先进行全局聚合，再进行局部分布建模。该设计使得长程依赖关系在大尺度模式区域中得到更可靠的利用，而在小尺度模式区域中则更侧重局部细节的保留。网络在每个位置通过通道级掩码图（per-channel mask map）动态估计不同模式的尺寸。GALD模块可端到端训练，且能够无缝集成到各类现有FCN架构中，适配多种全局聚合模块，适用于广泛的视觉任务。实验表明，GALD在多个前沿目标检测与实例分割方法上均能一致提升性能。尤其在语义分割任务中，GALD在Cityscapes测试集上取得了83.3%的mIoU，刷新了当前最优结果。代码已开源，地址为：https://github.com/lxtGH/GALD-Net。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供