HyperAIHyperAI

Command Palette

Search for a command to run...

vor 6 Stunden

MSRNet: Ein mehrskaliges rekursives Netzwerk zur Detektion getarnter Objekte

Leena Alghamdi Muhammad Usman Hafeez Anwar Abdul Bais Saeed Anwar

MSRNet: Ein mehrskaliges rekursives Netzwerk zur Detektion getarnter Objekte

Abstract

Hier ist die Übersetzung des Textes ins Deutsche, unter Berücksichtigung des akademischen Stils und der Fachterminologie:Die Detektion getarnter Objekte (Camouflaged Object Detection) ist eine aufstrebende und anspruchsvolle Aufgabe im Bereich der Computer Vision. Sie erfordert die Identifizierung und Segmentierung von Objekten, die aufgrund hoher Ähnlichkeit in Farbe, Textur und Größe nahtlos mit ihrer Umgebung verschmelzen. Diese Aufgabe wird zusätzlich durch schlechte Lichtverhältnisse, teilweise Verdeckung, geringe Objektgröße, komplexe Hintergrundmuster und das Vorhandensein mehrerer Objekte erschwert. Während viele hochentwickelte Methoden für diese Aufgabe vorgeschlagen wurden, haben aktuelle Verfahren nach wie vor Schwierigkeiten, getarnte Objekte in komplexen Szenarien präzise zu erkennen – insbesondere bei kleinen und mehreren Objekten –, was auf weiteren Verbesserungsbedarf hindeutet.Wir schlagen ein Multi-Scale Recursive Network vor, das mehrskalige Merkmale über ein Pyramid Vision Transformer-Backbone extrahiert und diese mittels spezialisierter Attention-Based Scale Integration Units kombiniert, was eine selektive Zusammenführung von Merkmalen ermöglicht. Für eine präzisere Objekterkennung verfeinert unser Decoder die Merkmale rekursiv durch die Einbindung von Multi-Granularity Fusion Units. Eine neuartige rekursive Feedback-Decodierungsstrategie wurde entwickelt, um das Verständnis des globalen Kontexts zu verbessern und dem Modell zu helfen, die Herausforderungen dieser Aufgabe zu bewältigen. Durch die gemeinsame Nutzung von mehrskaligem Lernen (Multi-Scale Learning) und rekursiver Merkmalsoptimierung erzielt unsere vorgeschlagene Methode Leistungssteigerungen und erkennt erfolgreich kleine sowie mehrere getarnte Objekte. Unser Modell erzielt auf zwei Benchmark-Datensätzen für die Detektion getarnter Objekte State-of-the-Art-Ergebnisse und belegt auf den verbleibenden zwei Datensätzen den zweiten Platz. Unser Code, die Modellgewichte und die Ergebnisse sind unter href{https://github.com/linaagh98/MSRNet}{https://github.com/linaagh98/MSRNet} verfügbar.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
MSRNet: Ein mehrskaliges rekursives Netzwerk zur Detektion getarnter Objekte | Forschungsarbeiten | HyperAI