HyperAIHyperAI

Command Palette

Search for a command to run...

Mehrsichtdetektion mit Shadow Transformer (und view-kohärenter Datenverstärkung)

Yunzhong Hou Liang Zheng

Zusammenfassung

Die Multiview-Erkennung integriert mehrere Kameraperspektiven, um Verdeckungen zu bewältigen, und ihr zentrales Problem ist die Aggregation der Multiview-Informationen. Angesichts von Merkmalskartenprojektionen aus mehreren Perspektiven auf eine gemeinsame Grundebene löst die neueste Methode dieses Problem durch Faltung, wobei dieselbe Berechnung unabhängig vom Objektstandort angewendet wird. Allerdings könnten solche translationsinvariante Verhaltensweisen nicht die beste Wahl sein, da Objektmerkmale je nach ihrer Position und den verwendeten Kameras unterschiedliche Projektionsverzerrungen unterliegen. In dieser Arbeit schlagen wir einen neuen Multiview-Detektor, MVDeTr (Multi-View Detection Transformer), vor, der einen neu eingeführten Schatten-Transformer zur Aggregation der Multiview-Informationen verwendet. Im Gegensatz zu Faltungen richtet der Schatten-Transformer seine Aufmerksamkeit je nach Position und Kamera unterschiedlich aus, um verschiedene schattenartige Verzerrungen zu behandeln. Wir stellen ein effektives Trainingsverfahren vor, das eine neue view-konsistente Datenverstärkungsmethode einschließt, die zufällige Verstärkungen anwendet, während sie die Konsistenz zwischen den verschiedenen Perspektiven beibehält. An zwei Benchmarks für Multiview-Erkennung melden wir mit dem vorgeschlagenen System neue Standards in Bezug auf Genauigkeit. Der Quellcode ist unter https://github.com/hou-yz/MVDeTr verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Mehrsichtdetektion mit Shadow Transformer (und view-kohärenter Datenverstärkung) | Paper | HyperAI