2 个月前

级联R-CNN:高质量目标检测与实例分割

Zhaowei Cai; Nuno Vasconcelos
级联R-CNN:高质量目标检测与实例分割
摘要

在目标检测中,交并比(Intersection over Union, IoU)阈值常用于定义正负样本。训练检测器时所使用的阈值决定了其\textit{质量}。虽然常用的0.5阈值会导致噪声(低质量)检测,但当使用更大的阈值时,检测性能通常会下降。高质量检测的这一悖论有两个原因:1) 过拟合,由于大阈值下正样本数量急剧减少;2) 检测器与测试假设之间的推理时间质量不匹配。为了解决这些问题,提出了一种多阶段目标检测架构——级联R-CNN(Cascade R-CNN),该架构由一系列使用逐渐增大的IoU阈值训练的检测器组成。这些检测器依次进行训练,前一个检测器的输出作为下一个检测器的训练集。这种重采样过程逐步提高了假设的质量,确保所有检测器都有相同规模的正样本训练集,并最小化了过拟合问题。在推理过程中也应用了相同的级联结构,以消除假设与检测器之间的质量不匹配。一种没有额外复杂设计的级联R-CNN实现,在COCO数据集上达到了最先进的性能,并显著提升了通用和特定目标检测数据集(包括VOC、KITTI、CityPerson和WiderFace)上的高质量检测效果。最后,级联R-CNN被推广到实例分割任务中,在Mask R-CNN的基础上取得了非平凡的改进。为了促进未来的研究,提供了两种实现方式:\url{https://github.com/zhaoweicai/cascade-rcnn}(基于Caffe)和\url{https://github.com/zhaoweicai/Detectron-Cascade-RCNN}(基于Detectron)。