Saliences Visuelles Basées sur l'Analyse de l'Espace-Echelle dans le Domaine Fréquentiel

Nous abordons la question de la salience visuelle sous trois angles. Premièrement, nous considérons la détection de la salience comme un problème d'analyse dans le domaine fréquentiel. Deuxièmement, nous atteignons cet objectif en utilisant le concept de non-salience. Troisièmement, nous prenons simultanément en compte la détection des régions salientes de différentes tailles. L'article propose un nouveau paradigme bottom-up pour détecter la salience visuelle, caractérisé par une analyse multi-échelle du spectre d'amplitude des images naturelles. Nous montrons que la convolution du spectre d'amplitude de l'image avec un noyau gaussien passe-bas à une échelle appropriée est équivalente à un tel détecteur de salience d'image. La carte de salience est obtenue en reconstruisant le signal 2D en utilisant la phase originale et le spectre d'amplitude filtré à une échelle choisie en minimisant l'entropie de la carte de salience. Une Transformée de Fourier hypercomplexe effectue l'analyse dans le domaine fréquentiel. À l'aide de bases de données disponibles, nous démontrons expérimentalement que le modèle proposé peut prédire les données de fixations humaines. Nous introduisons également une nouvelle base de données d'images et utilisons celle-ci pour montrer que le détecteur de salience peut mettre en évidence à la fois des régions salientes petites et grandes, ainsi qu'inhiber les distracteurs répétés dans les images encombrées. En outre, nous montrons qu'il est capable de prédire les régions sur lesquelles les personnes concentrent leur attention.