RTMDet: Eine empirische Studie zur Gestaltung von Echtzeit-Objekterkennern
RTMDet: Eine empirische Studie zur Gestaltung von Echtzeit-Objekterkennern
Chengqi Lyu Wenwei Zhang Haian Huang Yue Zhou Yudong Wang Yanyi Liu Shilong Zhang Kai Chen

Abstract
In dieser Arbeit streben wir danach, einen effizienten Echtzeit-Objekterkennungsdetektor zu entwickeln, der die YOLO-Reihe übertrifft und leicht erweiterbar für verschiedene Objekterkennungsaufgaben wie Instanzsegmentierung und gedrehte Objekterkennung ist. Um eine effizientere Modellarchitektur zu erreichen, untersuchen wir eine Architektur mit kompatiblen Kapazitäten im Backbone und im Neck, die durch ein grundlegendes Bauteil gebildet wird, das aus großen Kern-Tiefenkonvolutionen besteht. Des Weiteren führen wir weiche Labels (soft labels) bei der Berechnung von Matching-Kosten in der dynamischen Labelzuordnung ein, um die Genauigkeit zu verbessern. Zusammen mit fortgeschritteneren Trainingsmethoden erreicht der resultierende Objektdetektor, der als RTMDet bezeichnet wird, eine AP von 52,8 % auf COCO bei mehr als 300 FPS auf einer NVIDIA 3090 GPU und übertrifft damit die aktuellen Hauptströmungen industrieller Detektoren. RTMDet bietet den besten Kompromiss zwischen Parametern und Genauigkeit in verschiedenen Anwendungsszenarien mit winzigen/kleinen/mittelgroßen/großen/sehr großen Modellgrößen und erzielt neue Standartwerte in Echtzeit-Instanzsegmentierung und gedrehter Objekterkennung. Wir hoffen, dass die experimentellen Ergebnisse neue Erkenntnisse für die Entwicklung vielseitiger Echtzeit-Objektdetektoren für verschiedene Objekterkennungsaufgaben liefern. Der Quellcode und die Modelle sind unter https://github.com/open-mmlab/mmdetection/tree/3.x/configs/rtmdet veröffentlicht.
Code-Repositories
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| object-detection-in-aerial-images-on-dota-1-0 | RTMDet-R-l (single scale) | mAP: 80.16% |
| object-detection-in-aerial-images-on-dota-1-0 | RTMDet-R-l | mAP: 81.33% |
| object-detection-in-aerial-images-on-hrsc2016 | RTMDet-R-tiny | mAP-07: 90.6 mAP-12: 97.10 |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-l | - |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-x | - |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-m | - |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-s | - |
| real-time-instance-segmentation-on-mscoco-1k | RTMDet-Ins-x | APM: 49.0 |
| real-time-instance-segmentation-on-multi30k | RTMDet-Ins-s | mask AP: 38.7 |
| real-time-object-detection-on-coco | RTMDet | box AP: 52.8 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.