vor 8 Monaten

Zusammenfassung

Die Multiview-Erkennung integriert mehrere Kameraperspektiven, um Verdeckungen zu bewältigen, und ihr zentrales Problem ist die Aggregation der Multiview-Informationen. Angesichts von Merkmalskartenprojektionen aus mehreren Perspektiven auf eine gemeinsame Grundebene löst die neueste Methode dieses Problem durch Faltung, wobei dieselbe Berechnung unabhängig vom Objektstandort angewendet wird. Allerdings könnten solche translationsinvariante Verhaltensweisen nicht die beste Wahl sein, da Objektmerkmale je nach ihrer Position und den verwendeten Kameras unterschiedliche Projektionsverzerrungen unterliegen. In dieser Arbeit schlagen wir einen neuen Multiview-Detektor, MVDeTr (Multi-View Detection Transformer), vor, der einen neu eingeführten Schatten-Transformer zur Aggregation der Multiview-Informationen verwendet. Im Gegensatz zu Faltungen richtet der Schatten-Transformer seine Aufmerksamkeit je nach Position und Kamera unterschiedlich aus, um verschiedene schattenartige Verzerrungen zu behandeln. Wir stellen ein effektives Trainingsverfahren vor, das eine neue view-konsistente Datenverstärkungsmethode einschließt, die zufällige Verstärkungen anwendet, während sie die Konsistenz zwischen den verschiedenen Perspektiven beibehält. An zwei Benchmarks für Multiview-Erkennung melden wir mit dem vorgeschlagenen System neue Standards in Bezug auf Genauigkeit. Der Quellcode ist unter https://github.com/hou-yz/MVDeTr verfügbar.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Yunzhong Hou Liang Zheng

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Objekterkennung

Faltungsneuronales Netzwerk

Yunzhong Hou Liang Zheng

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Mehrsichtdetektion mit Shadow Transformer (und view-kohärenter Datenverstärkung)

Yunzhong Hou Liang Zheng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mehrsichtdetektion mit Shadow Transformer (und view-kohärenter Datenverstärkung)

Yunzhong Hou Liang Zheng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Mehrsichtdetektion mit Shadow Transformer (und view-kohärenter Datenverstärkung)

Yunzhong Hou Liang Zheng

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters