HyperAIHyperAI

Command Palette

Search for a command to run...

Sparse R-CNN: End-to-End-Objekterkennung mit lernbaren Vorschlägen

Zusammenfassung

Wir präsentieren Sparse R-CNN, eine rein sparsame Methode für die Objekterkennung in Bildern. Bestehende Ansätze zur Objekterkennung stützen sich stark auf dichte Objektkandidaten, beispielsweise kkk vordefinierte Anchor-Boxen, die auf allen Gitterpunkten einer Bildmerkmalskarte der Größe H×WH \times WH×W vorgegeben sind. In unserer Methode hingegen wird dem Objekterkennungskopf eine feste, sparsame Menge an gelernten Objektvorschlägen mit insgesamt NNN Elementen zur Verfügung gestellt, um Klassifikation und Lokalisierung durchzuführen. Durch die Eliminierung der HWkHWkHWk (bis zu Hunderttausenden) handgezeichneten Objektkandidaten zugunsten von NNN (z. B. 100) lernbaren Vorschlägen vermeidet Sparse R-CNN vollständig alle Anstrengungen im Zusammenhang mit der Gestaltung von Objektkandidaten sowie die mehr-zu-eins-Zuordnung von Labels. Vor allem ist die endgültige Vorhersage direkt ohne nachgeschaltete Nicht-Maximum-Suppression (NMS) zu erzeugen. Sparse R-CNN erreicht auf dem anspruchsvollen COCO-Datensatz eine Genauigkeit, Laufzeit und Trainingskonvergenz, die mit etablierten Baselines vergleichbar sind, beispielsweise 45,0 AP im Standard-3×3\times3×-Trainingsplan und eine Geschwindigkeit von 22 fps unter Verwendung des ResNet-50 FPN-Modells. Wir hoffen, dass unsere Arbeit die etablierte Praxis der Verwendung dichter Vorkenntnisse in Objekterkennern neu überdenken lässt. Der Quellcode ist verfügbar unter: https://github.com/PeizeSun/SparseR-CNN.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp