HyperAIHyperAI

Command Palette

Search for a command to run...

Dynamic Head: Objektdetektionsköpfe durch Aufmerksamkeit vereinheitlichen

Xiyang Dai Yinpeng Chen Bin Xiao Dongdong Chen Mengchen Liu Lu Yuan Lei Zhang

Zusammenfassung

Die komplexe Natur der Kombination von Lokalisierung und Klassifikation im Objektdetektionsprozess hat eine florierende Entwicklung von Methoden hervorgebracht. Frühere Arbeiten versuchten, die Leistung verschiedener Objektdetektionsköpfe zu verbessern, konnten jedoch kein einheitliches Konzept vorlegen. In diesem Paper stellen wir einen neuartigen dynamischen Kopf-Framework vor, der Objektdetektionsköpfe mit Aufmerksamkeitsmechanismen vereint. Durch die kohärente Kombination mehrerer selbst-Attention-Mechanismen zwischen Merkmalsstufen zur Skalenerkennung, zwischen räumlichen Positionen zur räumlichen Erkennung und innerhalb der Ausgabekanäle zur Aufgabenorientierung, verbessert der vorgeschlagene Ansatz signifikant die Repräsentationsfähigkeit von Objektdetektionsköpfen ohne zusätzlichen Rechenaufwand. Weitere Experimente belegen die Effektivität und Effizienz des vorgeschlagenen dynamischen Kopfes am COCO-Benchmark. Mit einem standardisierten ResNeXt-101-DCN-Backbone erreichen wir eine erhebliche Leistungssteigerung gegenüber etablierten Objektdetektoren und erzielen eine neue State-of-the-Art-Ergebnis von 54,0 AP. Darüber hinaus, unter Verwendung eines modernen Transformer-Backbones und zusätzlicher Trainingsdaten, gelingt es uns, die bisher beste COCO-Ergebnis auf einen neuen Rekord von 60,6 AP zu heben. Der Quellcode wird unter https://github.com/microsoft/DynamicHead veröffentlicht werden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Dynamic Head: Objektdetektionsköpfe durch Aufmerksamkeit vereinheitlichen | Paper | HyperAI