
要約
本研究は、SKU-110kという高密度シーンデータセットの問題解決に向けたものである。当研究では、Cascade R-CNNを基に改良を行い、問題を解決するためにランダムクロップ戦略を提案した。この戦略は、通常のランダムクロップと対比して、サンプリング率と入力スケールが相対的に十分になるように設計されている。また、いくつかのテクニックを採用し、ハイパーパラメータを最適化した。高密度シーンの重要な特徴を捉えるために、検出器の各段階を分析し、性能を制限するボトルネックを探った。その結果、当方法はSKU-110kテストセットで58.7 mAP(mean Average Precision)の精度を得ることができた。