8 个月前

摘要

这项工作是对密集场景数据集SKU-110k的一个解决方案。我们的方法基于Cascade R-CNN进行了改进。为了解决问题，我们提出了一种随机裁剪策略，以确保采样率和输入尺度相对充足，这与常规的随机裁剪形成了对比。此外，我们采用了一些技巧并优化了超参数。为了捕捉密集场景的本质特征，我们分析了检测器的各个阶段，并研究了限制性能的瓶颈。最终，我们的方法在SKU-110k测试集上获得了58.7 mAP的成绩。

源 PDF