HyperAIHyperAI

Command Palette

Search for a command to run...

SPAN : Réseau d'attention à pyramide spatiale pour la localisation de la manipulation d'images

Zhenheng Yang Zhihan Zhang Zhenye Jiang Xuefeng Hu Ram Nevatia Syomantak Chaudhuri

Résumé

Les techniques de manipulation d’images évoluent rapidement ; si elles s’avèrent utiles pour de nombreuses tâches pertinentes, elles représentent également une menace pour la société en raison de leur capacité à produire des informations trompeuses crédibles. Nous proposons un nouveau modèle, le Réseau d’Attention en Pyramide Spatiale (SPAN), destiné à détecter et localiser plusieurs types de manipulations d’images. L’architecture proposée modélise efficacement et de manière performante les relations entre des patches d’image à plusieurs échelles en construisant une pyramide de blocs d’attention auto-localisée. Elle intègre une nouvelle projection de position permettant de coder les positions spatiales des patches. SPAN est entraîné sur un jeu de données synthétiques, mais peut également être affiné pour des jeux de données spécifiques. La méthode proposée obtient des gains significatifs en performance sur des jeux de données standards par rapport aux approches précédemment les plus avancées.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp