Command Palette
Search for a command to run...
级联RPN:通过自适应卷积深入探究高质量区域提议网络
级联RPN:通过自适应卷积深入探究高质量区域提议网络
Thang Vu Hyunjun Jang Trung X. Pham Chang D. Yoo
摘要
本文提出一种称为级联区域建议网络(Cascade Region Proposal Network, Cascade RPN)的架构,旨在通过系统性地解决传统区域建议网络(RPN)存在的局限性,从而提升区域建议质量与目标检测性能。传统RPN存在三个关键问题:基于启发式方法定义锚框(anchors)、将特征与锚框进行对齐,而这些设定往往难以适应复杂场景。为克服上述问题,本文提出以下两方面改进:首先,与传统方法中在每个位置使用多个预定义尺度和长宽比的锚框不同,Cascade RPN在每个位置仅使用单一锚框,并通过多阶段迭代优化逐步提升建议质量。在初始阶段,采用无锚框度量(anchor-free metric)进行正样本筛选,后续阶段则逐步引入基于锚框的度量方式,使每一阶段对正样本的判定标准更加严格,从而实现更高质量的区域建议。其次,为确保在多阶段过程中特征与锚框之间保持良好的对齐关系,本文提出一种自适应卷积(adaptive convolution)机制。该机制将锚框信息与图像特征共同作为输入,通过锚框引导网络学习更具判别性的特征表示,实现特征与锚框之间的动态对齐。实验结果表明,一个简单的两阶段Cascade RPN实现,在平均召回率(AR)上比传统RPN提升13.4个百分点,显著超越了所有现有区域建议方法。当集成至Fast R-CNN和Faster R-CNN检测框架时,Cascade RPN分别将检测平均精度(mAP)提升3.1和3.5个百分点。相关代码已公开,地址为:https://github.com/thangvubk/Cascade-RPN.git。