HyperAIHyperAI
vor 2 Monaten

Heran- und Herauszoomen: Ein Mixed-Scale Triplettennetzwerk für die Erkennung getarnter Objekte

Pang, Youwei ; Zhao, Xiaoqi ; Xiang, Tian-Zhu ; Zhang, Lihe ; Lu, Huchuan
Heran- und Herauszoomen: Ein Mixed-Scale Triplettennetzwerk für die Erkennung getarnter Objekte
Abstract

Der kürzlich vorgeschlagene Tarnobjekterkennung (TOD) versucht, Objekte zu segmentieren, die visuell in ihre Umgebung integriert sind, was in realen Szenarien äußerst komplex und schwierig ist. Neben der hohen intrinsischen Ähnlichkeit zwischen den getarnten Objekten und ihrem Hintergrund sind diese Objekte in der Regel vielfältig in ihrer Größe, unscharf im Erscheinungsbild und können sogar stark verdeckt sein. Um mit diesen Problemen fertig zu werden, schlagen wir ein gemischt-skaliertes Tripletten-Netzwerk vor, das \textbf{ZoomNet} genannt wird. Dieses Netzwerk imitiert das Verhalten von Menschen beim Betrachten unscharfer Bilder, d.h., es zoomt rein und heraus. Insbesondere verwendet unser ZoomNet die Zoom-Strategie, um diskriminative gemischt-skalierte Semantiken durch die entwickelte Skalenintegrationskomponente und die hierarchische gemischt-skalierte Komponente zu lernen. Dabei werden unsichtbare Hinweise zwischen den Kandidatenobjekten und dem Hintergrundumfeld vollständig ausgeschöpft. Darüber hinaus berücksichtigen wir die Unsicherheit und Ambiguität, die sich aus nicht unterscheidbaren Texturen ableitet. Wir bauen eine einfache aber effektive Regularisierungseinschränkung, den unsicherheitsbewussten Verlust (uncertainty-aware loss), um das Modell dazu anzuregen, Vorhersagen mit höherem Konfidenzniveau in den Kandidatenbereichen genau zu erzeugen. Ohne aufwendige Zusatzmethoden übertrifft unser vorgeschlagenes hochgradig task-freundliches Modell konsistent 23 bestehende Stand-of-the-Art-Methoden auf vier öffentlichen Datensätzen. Zudem bestätigt die überlegene Leistung gegenüber den jüngsten Cutting-Edge-Modellen bei der SOD-Aufgabe auch die Effektivität und Allgemeingültigkeit unseres Modells. Der Code wird unter \url{https://github.com/lartpang/ZoomNet} zur Verfügung gestellt.

Heran- und Herauszoomen: Ein Mixed-Scale Triplettennetzwerk für die Erkennung getarnter Objekte | Neueste Forschungsarbeiten | HyperAI