HyperAIHyperAI
vor 2 Monaten

Visuelle Salienz basierend auf Skalenraumanalyse im Frequenzbereich

Jian Li; Martin Levine; Xiangjing An; Xin Xu; Hangen He
Visuelle Salienz basierend auf Skalenraumanalyse im Frequenzbereich
Abstract

Wir behandeln das Problem der visuellen Aufmerksamkeit (saliency) aus drei Perspektiven. Erstens betrachten wir die Saliendetektion als ein Problem der Frequenzbereichsanalyse. Zweitens erreichen wir dies durch die Anwendung des Konzepts der {\it Nicht-Aufmerksamkeit (non-saliency)}. Drittens berücksichtigen wir gleichzeitig die Detektion von Aufmerksamkeitsregionen unterschiedlicher Größe. Der Artikel schlägt ein neues bottom-up Paradigma zur Detektion von visueller Aufmerksamkeit vor, das durch eine Skalenraumanalyse des Amplitudenspektrums natürlicher Bilder gekennzeichnet ist. Wir zeigen, dass die Faltung des {\it Bildamplitudenspektrums} mit einem tiefpassfilternden Gauß-Kern eines geeigneten Skalierungsfaktors äquivalent zu einem solchen Bildsaliendetektor ist. Die Salienzkarte wird durch die Rekonstruktion des 2D-Signals unter Verwendung des ursprünglichen Phasenwinkels und des amplitudenfilterten Spektrums erhalten, wobei die Skala durch Minimierung der Entropie der Salienzkarte ausgewählt wird. Eine Hyperkomplexe Fourier-Transformation führt die Analyse im Frequenzbereich durch. Mit Hilfe verfügbarer Datenbanken demonstrieren wir experimentell, dass das vorgeschlagene Modell menschliche Fixationsdaten vorhersagen kann. Wir stellen außerdem eine neue Bild-Datenbank vor und verwenden sie, um zu zeigen, dass der Saliendetektor sowohl kleine als auch große Aufmerksamkeitsregionen hervorheben sowie wiederholte Störelemente in komplexen Bildern unterdrücken kann. Darüber hinaus zeigen wir, dass er in der Lage ist, Regionen vorherzusagen, auf denen Menschen ihre Aufmerksamkeit fokussieren.

Visuelle Salienz basierend auf Skalenraumanalyse im Frequenzbereich | Neueste Forschungsarbeiten | HyperAI