HyperAIHyperAI

Command Palette

Search for a command to run...

U2^22-Net: Tiefer Eintauchen in die geschachtelte U-Struktur für die Detektion von auffälligen Objekten

Xuebin Qin, Zichen Zhang, Chenyang Huang, Masood Dehghan, Osmar R. Zaiane, Martin Jagersand

Zusammenfassung

In dieser Arbeit entwerfen wir eine einfache, aber leistungsfähige Deep-Network-Architektur, die U2^22-Net, für die Erkennung von prominenten Objekten (Salient Object Detection, SOD). Die Architektur unseres U2^22-Net besteht aus einer zweistufigen verschachtelten U-Struktur. Das Design hat folgende Vorteile: (1) Es kann dank der Mischung von Rezeptivfeldern unterschiedlicher Größen in den vorgeschlagenen Residuellen U-Blöcken (RSU) mehr kontextuelle Information aus verschiedenen Skalen erfassen, (2) es erhöht die Tiefe der gesamten Architektur ohne die Rechenkosten erheblich zu steigern, aufgrund der in diesen RSU-Blöcken verwendeten Pooling-Operationen. Diese Architektur ermöglicht es uns, ein tiefes Netzwerk von Grund auf zu trainieren, ohne auf Backbones aus Bildklassifizierungsaufgaben zurückzugreifen. Wir realisieren zwei Modelle der vorgeschlagenen Architektur: U2^22-Net (176,3 MB, 30 FPS auf GTX 1080Ti GPU) und U2^22-Net^{\dagger} (4,7 MB, 40 FPS), um die Verwendung in verschiedenen Umgebungen zu erleichtern. Beide Modelle erzielen wettbewerbsfähige Ergebnisse auf sechs SOD-Datensätzen. Der Code ist verfügbar: https://github.com/NathanUA/U-2-Net.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp