HyperAIHyperAI
vor 2 Monaten

Eine Lösung für die Produkterkennung in dicht bepackten Szenen

Rong, Tianze ; Zhu, Yanjia ; Cai, Hongxiang ; Xiong, Yichao
Eine Lösung für die Produkterkennung in dicht bepackten Szenen
Abstract

Diese Arbeit stellt eine Lösung für den dicht besetzten Szenen-Datensatz SKU-110k dar. Unser Ansatz basiert auf einer Modifikation des Cascade R-CNN. Um das Problem zu lösen, schlugen wir eine zufällige Zuschneidestrategie (random crop strategy) vor, die sowohl die Stichprobenrate als auch die Eingabegröße im Vergleich zur konventionellen zufälligen Zuschneidung relativ ausreichend sicherstellt. Zudem haben wir einige Trick angewendet und die Hyperparameter optimiert. Um die wesentlichen Merkmale der dicht besetzten Szenen zu erfassen, analysierten wir die Stufen eines Detektors und untersuchten den Engpass, der die Leistung begrenzt. Als Ergebnis erreicht unsere Methode einen mAP-Wert von 58,7 auf dem Testdatensatz von SKU-110k.

Eine Lösung für die Produkterkennung in dicht bepackten Szenen | Neueste Forschungsarbeiten | HyperAI