HyperAIHyperAI

Command Palette

Search for a command to run...

Heran- und Herauszoomen: Ein Mixed-Scale Triplettennetzwerk für die Erkennung getarnter Objekte

Youwei Pang extsuperscript1 extsuperscript† Xiaoqi Zhao extsuperscript1 extsuperscript‡ Tian-Zhu Xiang extsuperscript3 Lihe Zhang extsuperscript1 extsuperscript* Huchuan Lu extsuperscript1,2

Zusammenfassung

Der kürzlich vorgeschlagene Tarnobjekterkennung (TOD) versucht, Objekte zu segmentieren, die visuell in ihre Umgebung integriert sind, was in realen Szenarien äußerst komplex und schwierig ist. Neben der hohen intrinsischen Ähnlichkeit zwischen den getarnten Objekten und ihrem Hintergrund sind diese Objekte in der Regel vielfältig in ihrer Größe, unscharf im Erscheinungsbild und können sogar stark verdeckt sein. Um mit diesen Problemen fertig zu werden, schlagen wir ein gemischt-skaliertes Tripletten-Netzwerk vor, das \textbf{ZoomNet} genannt wird. Dieses Netzwerk imitiert das Verhalten von Menschen beim Betrachten unscharfer Bilder, d.h., es zoomt rein und heraus. Insbesondere verwendet unser ZoomNet die Zoom-Strategie, um diskriminative gemischt-skalierte Semantiken durch die entwickelte Skalenintegrationskomponente und die hierarchische gemischt-skalierte Komponente zu lernen. Dabei werden unsichtbare Hinweise zwischen den Kandidatenobjekten und dem Hintergrundumfeld vollständig ausgeschöpft. Darüber hinaus berücksichtigen wir die Unsicherheit und Ambiguität, die sich aus nicht unterscheidbaren Texturen ableitet. Wir bauen eine einfache aber effektive Regularisierungseinschränkung, den unsicherheitsbewussten Verlust (uncertainty-aware loss), um das Modell dazu anzuregen, Vorhersagen mit höherem Konfidenzniveau in den Kandidatenbereichen genau zu erzeugen. Ohne aufwendige Zusatzmethoden übertrifft unser vorgeschlagenes hochgradig task-freundliches Modell konsistent 23 bestehende Stand-of-the-Art-Methoden auf vier öffentlichen Datensätzen. Zudem bestätigt die überlegene Leistung gegenüber den jüngsten Cutting-Edge-Modellen bei der SOD-Aufgabe auch die Effektivität und Allgemeingültigkeit unseres Modells. Der Code wird unter \url{https://github.com/lartpang/ZoomNet} zur Verfügung gestellt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp