HyperAIHyperAI

Command Palette

Search for a command to run...

Deformable DETR: Deformable Transformers für end-to-end Objekterkennung

Xizhou Zhu Weijie Su Lewei Lu Bin Li Xiaogang Wang Jifeng Dai

Zusammenfassung

DETR wurde kürzlich vorgeschlagen, um die Notwendigkeit vieler handkodierter Komponenten im Objektdetektionsprozess zu beseitigen, während gleichzeitig eine gute Leistung erzielt wird. Allerdings leidet es unter langsamer Konvergenz und begrenzter räumlicher Auflösung der Merkmale, was auf die Einschränkungen der Transformer-Attention-Module bei der Verarbeitung von Bildmerkmalskarten zurückzuführen ist. Um diese Probleme zu mildern, schlagen wir Deformable DETR vor, dessen Attention-Module sich nur auf eine kleine Menge von Schlüssel-Sampling-Punkten in der Nähe eines Referenzpunkts konzentrieren. Deformable DETR erreicht eine bessere Leistung als DETR (insbesondere bei kleinen Objekten) bei nur zehnmal weniger Trainings-Epochen. Umfangreiche Experimente auf der COCO-Benchmark bestätigen die Wirksamkeit unseres Ansatzes. Der Quellcode ist unter https://github.com/fundamentalvision/Deformable-DETR verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp