HyperAIHyperAI
vor 2 Monaten

TP-LSD: Tri-Points-basierter Liniensegment-Detektor

Huang, Siyu ; Qin, Fangbo ; Xiong, Pengfei ; Ding, Ning ; He, Yijia ; Liu, Xiao
TP-LSD: Tri-Points-basierter Liniensegment-Detektor
Abstract

In dieser Arbeit wird ein neues tiefes Faltungsmodell, der Tri-Points Based Line Segment Detector (TP-LSD), vorgeschlagen, um Liniensegmente in Bildern in Echtzeit zu erkennen. Die bisherigen verwandten Methoden verwenden in der Regel eine zweistufige Strategie, die entweder auf heuristische Nachbearbeitung oder zusätzliche Klassifizierer angewiesen ist. Um eine einstufige Erkennung mit einem schnelleren und kompakteren Modell zu realisieren, führen wir die Dreipunktdarstellung ein, die die Erkennung von Liniensegmenten in eine end-to-end-Vorhersage eines Wurzelpunkts und zweier Endpunkte für jedes Liniensegment umwandelt.Der TP-LSD verfügt über zwei Zweige: den Dreipunkte-Extraktionszweig und den Linien-Segmentierungszweig. Der erste prognostiziert das Heatmap der Wurzelpunkte und die beiden Verschiebungskarten der Endpunkte. Der zweite trennt die Pixel auf geraden Linien vom Hintergrund. Darüber hinaus wird die Linien-Segmentierungskarte im ersten Zweig als strukturelles Vorwissen wiederverwendet. Wir schlagen außerdem eine neue Bewertungsmetrik vor und evaluieren unsere Methode anhand der Wireframe- und YorkUrban-Datensätze, was nicht nur eine vergleichbare Genauigkeit mit den neuesten Methoden zeigt, sondern auch eine Echtzeitgeschwindigkeit von bis zu 78 FPS bei einer Eingabeauflösung von $320 \times 320$ erreicht.

TP-LSD: Tri-Points-basierter Liniensegment-Detektor | Neueste Forschungsarbeiten | HyperAI