HyperAIHyperAI
vor 2 Monaten

DT-LSD: Deformierbare Transformer-basierte Liniensegmenterkennung

Janampa, Sebastian ; Pattichis, Marios
DT-LSD: Deformierbare Transformer-basierte Liniensegmenterkennung
Abstract

Die Detektion von Liniensegmenten ist eine grundlegende Aufgabe auf niedriger Ebene in der Computer Vision, und Verbesserungen bei dieser Aufgabe können fortgeschrittene Methoden, die darauf basieren, erheblich beeinflussen. Die meisten neu entwickelten Methoden zur Detektion von Liniensegmenten stützen sich auf Faltungsneuronale Netze (CNNs). Unser Artikel beabsichtigt, Herausforderungen zu bewältigen, die die breitere Einführung von transformer-basierten Methoden für die Detektion von Liniensegmenten verhindern. Genauer gesagt führen wir ein neues Modell ein, das als Deformierter Transformer-basierter Liniensegmentendetektor (DT-LSD) bezeichnet wird und sowohl inter-skaliere Interaktionen unterstützt als auch schnell trainiert werden kann. Diese Arbeit schlägt einen neuen Deformierter Transformer-basierter Liniensegmentendetektor (DT-LSD) vor, der die Nachteile des LETR-Modells überwindet. Um das Training zu beschleunigen, stellen wir Line Contrastive DeNoising (LCDN) vor, eine Technik, die den ein-zu-eins Zuordnungsprozess stabilisiert und das Training um 34-fach beschleunigt. Wir zeigen, dass DT-LSD schneller und genauer als sein transformer-basierter Vorgänger (LETR) ist und alle CNN-basierten Modelle hinsichtlich der Genauigkeit übertrifft. Im Wireframe-Datensatz erreicht DT-LSD 71,7 für $sAP^{10}$ und 73,9 für $sAP^{15}$; im YorkUrban-Datensatz dagegen 33,2 für $sAP^{10}$ und 35,1 für $sAP^{15}$.

DT-LSD: Deformierbare Transformer-basierte Liniensegmenterkennung | Neueste Forschungsarbeiten | HyperAI