HyperAIHyperAI
vor 17 Tagen

VDDT: Verbesserung der Schiffserkennung durch deformierbaren Transformer

{Lefan Wang, Zhihui Chen, Ruixin Zheng, Jinhe Su, Yiling Liu, Siyu Chen}
Abstract

Die Erkennung von Schiffen hat in der Objekterkennung erhebliche Aufmerksamkeit erfahren, und der kürzlich vorgeschlagene DETR hat erfolgreich eine echte end-to-end-Objekterkennung realisiert und eine gute Leistung gezeigt. Allerdings ist DETR nicht empfindlich genug gegenüber der Erkennung kleiner Objekte, was zu einer unzureichenden Leistung bei der Schiffserkennung führt. In diesem Artikel verwenden wir Deformable DETR als Baseline-Modell und modifizieren es darauf aufbauend. Zunächst integrieren wir Referenzpunkt-Informationen in die Objekt-Queries, um die von den Objekt-Queries gelernten Merkmale zu verfeinern und die Leistung des Detektors zu verbessern. Zweitens ersetzen wir die Multi-Head-Self-Attention durch ein Multi-Layer-Perceptron, um den Rechenaufwand des Decoders zu verringern. Darüber hinaus haben wir 85 Videos mit insgesamt 4563 annotierten Bildern gesammelt und diese zur Erstellung eines Schiffserkennungs-Datensatzes verwendet. Die experimentellen Ergebnisse auf unserem Schiffserkennungs-Datensatz zeigen, dass VDDT gegenüber der Baseline eine bessere Leistung erzielt.