HyperAIHyperAI

Command Palette

Search for a command to run...

Detektion in überfüllten Szenen: Ein Vorschlag, mehrere Vorhersagen

Xuangeng Chu Anlin Zheng Xiangyu Zhang Jian Sun

Zusammenfassung

Wir schlagen einen einfachen, aber effektiven proposal-basierten Objektdetektor vor, der darauf abzielt, stark überlappende Instanzen in dicht besetzten Szenen zu erkennen. Der Schlüssel unseres Ansatzes besteht darin, dass jede Proposal eine Menge korrelierter Instanzen vorhersagt, anstatt wie in herkömmlichen proposal-basierten Frameworks lediglich eine einzelne Instanz vorherzusagen. Durch die Integration neuer Techniken wie der EMD-Loss-Funktion und Set-NMS kann unser Detektor die Schwierigkeiten bei der Erkennung stark überlappender Objekte effektiv bewältigen. Auf einer FPN-Res50-Basislinie erreicht unser Detektor auf dem anspruchsvollen CrowdHuman-Datensatz eine Verbesserung um 4,9 % im AP-Wert und auf dem CityPersons-Datensatz eine Verbesserung von 1,0 % im MR2\text{MR}^{-2}MR2-Wert, ohne zusätzliche Hilfsmittel („bells and whistles“). Zudem erzielt unsere Methode auch auf weniger dicht besetzten Datensätzen wie COCO moderate Verbesserungen, was darauf hinweist, dass der vorgeschlagene Ansatz robust gegenüber unterschiedlicher Dichte ist. Der Quellcode und vortrainierte Modelle werden unter https://github.com/megvii-model/CrowdDetection veröffentlicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp