HyperAIHyperAI

Command Palette

Search for a command to run...

Unsicherheitsgesteuerte RGB-D-Salienzdetektion

Jing Zhang Deng-Ping Fan Yuchao Dai Saeed Anwar Fatemeh Saleh Sadegh Aliakbarian Nick Barnes

Zusammenfassung

Wir schlagen den ersten stochastischen Ansatz vor, der Unsicherheit für die RGB-D-Salienzdetektion durch das Lernen aus dem Datenaufbereitungsprozess nutzt. Bestehende Modelle zur RGB-D-Salienzdetektion behandeln diese Aufgabe als Punktschätzproblem, indem sie eine einzelne Salienzkarte nach einem deterministischen Lernpipeline vorhersagen. Wir argumentieren jedoch, dass die deterministische Lösung relativ schlecht gestellt ist. Inspiriert von dem Prozess des Saliendatenaufbereitungs, schlagen wir eine generative Architektur vor, um eine wahrscheinlichkeitstheoretische RGB-D-Salienzdetektion zu erreichen, die eine latente Variable verwendet, um die Variationen im Aufbereitungsprozess zu modellieren. Unser Rahmenwerk umfasst zwei Hauptmodelle: 1) ein Generatormodell, das das Eingangsbild und die latente Variable auf eine stochastische Salienzvorhersage abbildet; und 2) ein Inferenzmodell, das die latente Variable schrittweise aktualisiert, indem es sie aus der wahren oder approximierten A-posteriori-Verteilung zieht. Das Generatormodell ist ein Encoder-Decoder-Salienznetzwerk. Um die latente Variable zu inferieren, führen wir zwei verschiedene Lösungen ein: i) einen bedingten Variational Auto-Encoder mit einem zusätzlichen Encoder zur Approximation der A-posteriori-Verteilung der latenten Variable; und ii) eine Technik des alternierenden Rückpropagations (Alternating Back-Propagation), die die latente Variable direkt aus der wahren A-posteriori-Verteilung zieht. Qualitative und quantitative Ergebnisse auf sechs anspruchsvollen RGB-D-Benchmarkdatensätzen zeigen die überlegene Leistung unseres Ansatzes beim Lernen der Verteilung von Salienzkarten. Der Quellcode ist über unsere Projektseite öffentlich verfügbar: https://github.com/JingZhang617/UCNet.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Unsicherheitsgesteuerte RGB-D-Salienzdetektion | Paper | HyperAI