HyperAIHyperAI
il y a 2 mois

Détection de la Saliences RGB-D Inspirée par l'Incertain

Jing Zhang; Deng-Ping Fan; Yuchao Dai; Saeed Anwar; Fatemeh Saleh; Sadegh Aliakbarian; Nick Barnes
Détection de la Saliences RGB-D Inspirée par l'Incertain
Résumé

Nous proposons le premier cadre stochastique utilisant l'incertitude pour la détection de la salience RGB-D en apprenant à partir du processus d'étiquetage des données. Les modèles existants de détection de salience RGB-D traitent cette tâche comme un problème d'estimation ponctuelle en prédissant une seule carte de salience suivant une pipeline d'apprentissage déterministe. Nous soutenons cependant que la solution déterministe est relativement mal posée. Inspirés par le processus d'étiquetage des données de salience, nous proposons une architecture générative pour réaliser une détection de salience RGB-D probabiliste, qui utilise une variable latente pour modéliser les variations d'étiquetage. Notre cadre comprend deux modèles principaux : 1) un modèle générateur, qui mappe l'image d'entrée et la variable latente vers une prédiction de salience stochastique, et 2) un modèle d'inférence, qui met progressivement à jour la variable latente en l'échantillonnant à partir de la distribution a posteriori vraie ou approximée. Le modèle générateur est un réseau de salience encodeur-décodeur. Pour inférer la variable latente, nous introduisons deux solutions différentes : i) un Auto-encodeur Variationnel Conditionnel avec un encodeur supplémentaire pour approcher la distribution a posteriori de la variable latente ; et ii) une technique de Rétropropagation Alternée, qui échantillonne directement la variable latente à partir de la distribution a posteriori vraie. Les résultats qualitatifs et quantitatifs sur six jeux de données基准数据集 (benchmark datasets) difficiles montrent que notre approche surpasse les autres méthodes dans l'apprentissage de la distribution des cartes de salience. Le code source est disponible au public via notre page de projet : https://github.com/JingZhang617/UCNet.注:在“six jeux de données基准数据集”中,“基准数据集”被保留为中文,因为这是特定领域的术语,可能没有通用的法语译法。如果需要进一步解释或有其他建议,请告知。