HyperAIHyperAI
il y a 11 jours

SPAN : Réseau d'attention à pyramide spatiale pour la localisation de la manipulation d'images

{Zhenheng Yang, Zhihan Zhang, Zhenye Jiang, Xuefeng Hu, Ram Nevatia, Syomantak Chaudhuri}
SPAN : Réseau d'attention à pyramide spatiale pour la localisation de la manipulation d'images
Résumé

Les techniques de manipulation d’images évoluent rapidement ; si elles s’avèrent utiles pour de nombreuses tâches pertinentes, elles représentent également une menace pour la société en raison de leur capacité à produire des informations trompeuses crédibles. Nous proposons un nouveau modèle, le Réseau d’Attention en Pyramide Spatiale (SPAN), destiné à détecter et localiser plusieurs types de manipulations d’images. L’architecture proposée modélise efficacement et de manière performante les relations entre des patches d’image à plusieurs échelles en construisant une pyramide de blocs d’attention auto-localisée. Elle intègre une nouvelle projection de position permettant de coder les positions spatiales des patches. SPAN est entraîné sur un jeu de données synthétiques, mais peut également être affiné pour des jeux de données spécifiques. La méthode proposée obtient des gains significatifs en performance sur des jeux de données standards par rapport aux approches précédemment les plus avancées.

SPAN : Réseau d'attention à pyramide spatiale pour la localisation de la manipulation d'images | Articles de recherche récents | HyperAI