
摘要
这项工作是对密集场景数据集SKU-110k的一个解决方案。我们的方法基于Cascade R-CNN进行了改进。为了解决问题,我们提出了一种随机裁剪策略,以确保采样率和输入尺度相对充足,这与常规的随机裁剪形成了对比。此外,我们采用了一些技巧并优化了超参数。为了捕捉密集场景的本质特征,我们分析了检测器的各个阶段,并研究了限制性能的瓶颈。最终,我们的方法在SKU-110k测试集上获得了58.7 mAP的成绩。
这项工作是对密集场景数据集SKU-110k的一个解决方案。我们的方法基于Cascade R-CNN进行了改进。为了解决问题,我们提出了一种随机裁剪策略,以确保采样率和输入尺度相对充足,这与常规的随机裁剪形成了对比。此外,我们采用了一些技巧并优化了超参数。为了捕捉密集场景的本质特征,我们分析了检测器的各个阶段,并研究了限制性能的瓶颈。最终,我们的方法在SKU-110k测试集上获得了58.7 mAP的成绩。