Command Palette
Search for a command to run...
Ein Starker und Wiederholbarer Objektdetektor mit Nur Öffentlichen Datensätzen
Ein Starker und Wiederholbarer Objektdetektor mit Nur Öffentlichen Datensätzen
Tianhe Ren Jianwei Yang Shilong Liu Ailing Zeng Feng Li Hao Zhang Hongyang Li Zhaoyang Zeng Lei Zhang
Zusammenfassung
Diese Arbeit präsentiert Focal-Stable-DINO, ein leistungsstarkes und reproduzierbares Objekterkennungsmodell, das auf dem COCO val2017-Datensatz eine AP von 64,6 und auf dem COCO test-dev-Datensatz eine AP von 64,8 erreicht, wobei lediglich 700 M Parameter verwendet werden und keine Testzeit-Augmentation eingesetzt wird. Das Modell untersucht die Kombination des leistungsstarken FocalNet-Huge-Backbones mit dem effektiven Stable-DINO-Detektor. Im Gegensatz zu bestehenden State-of-the-Art-Modellen, die eine große Anzahl an Parametern sowie komplexe Trainingsmethoden auf großskaligen, privaten oder zusammengesetzten Datensätzen nutzen, wurde unser Modell ausschließlich auf dem öffentlich verfügbaren Datensatz Objects365 trainiert. Dies gewährleistet die Reproduzierbarkeit unseres Ansatzes.