vor 2 Monaten
Eine Lösung für die Produkterkennung in dicht bepackten Szenen
Rong, Tianze ; Zhu, Yanjia ; Cai, Hongxiang ; Xiong, Yichao

Abstract
Diese Arbeit stellt eine Lösung für den dicht besetzten Szenen-Datensatz SKU-110k dar. Unser Ansatz basiert auf einer Modifikation des Cascade R-CNN. Um das Problem zu lösen, schlugen wir eine zufällige Zuschneidestrategie (random crop strategy) vor, die sowohl die Stichprobenrate als auch die Eingabegröße im Vergleich zur konventionellen zufälligen Zuschneidung relativ ausreichend sicherstellt. Zudem haben wir einige Trick angewendet und die Hyperparameter optimiert. Um die wesentlichen Merkmale der dicht besetzten Szenen zu erfassen, analysierten wir die Stufen eines Detektors und untersuchten den Engpass, der die Leistung begrenzt. Als Ergebnis erreicht unsere Methode einen mAP-Wert von 58,7 auf dem Testdatensatz von SKU-110k.