HyperAIHyperAI

Command Palette

Search for a command to run...

SPAN: Spatial Pyramid Attention Network für die Lokalisierung von Bildmanipulationen

Zhenheng Yang Zhihan Zhang Zhenye Jiang Xuefeng Hu Ram Nevatia Syomantak Chaudhuri

Zusammenfassung

Techniken zur Bildmanipulation entwickeln sich rasant; während sie für zahlreiche nützliche Aufgaben hilfreich sind, bergen sie auch eine Bedrohung für die Gesellschaft durch ihre Fähigkeit, überzeugende Falschinformationen zu erzeugen. Wir stellen ein neuartiges Netzwerk namens Spatial Pyramid Attention Network (SPAN) zur Erkennung und Lokalisierung mehrerer Arten von Bildmanipulationen vor. Die vorgeschlagene Architektur modelliert effizient und effektiv die Beziehungen zwischen Bildpatches auf mehreren Skalen durch den Aufbau einer Pyramide aus lokalen Self-Attention-Blöcken. Das Design beinhaltet eine neuartige Positionsprojektion, um die räumlichen Positionen der Patches zu kodieren. SPAN wird auf einem synthetischen Datensatz trainiert, kann jedoch auch für spezifische Datensätze feinabgestimmt werden. Die vorgeschlagene Methode erreicht signifikante Leistungsverbesserungen gegenüber bisherigen State-of-the-Art-Verfahren auf Standard-Datensätzen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp