HyperAIHyperAI

Command Palette

Search for a command to run...

Attrahiert Text die Aufmerksamkeit auf E-Commerce-Bildern? Ein neuartiges Saliency-Vorhersagedatensatz- und -verfahren

Bo Huang Yichen Guo Se Lei Mai Xu Shengxi Li Yifei Li Lai Jiang

Zusammenfassung

E-Commerce-Bilder spielen eine zentrale Rolle bei der Aufmerksamkeitsgewinnung im Online-Handel und der Online-Einkaufswelt, und eine präzise Aufmerksamkeitsvorhersage ist sowohl für Kunden als auch für Händler von erheblicher Bedeutung – wobei die Forschung auf diesem Gebiet bisher noch nicht begonnen hat. In diesem Artikel stellen wir erstmals den Datensatz „Saliency E-Commerce Images (SalECI)“ vor, der die Lernbarkeit zur Vorhersage von Aufmerksamkeitsmuster in E-Commerce-Bildern ermöglicht. Anschließend führen wir eine spezialisierte und umfassende Analyse durch, wobei wir die charakteristischen Merkmale von E-Commerce-Bildern herausstellen, wie beispielsweise die Nichtlokalität und die Korrelation zu textbasierten Regionen. Dementsprechend nutzen wir die Vorteile der Nichtlokalität und der Selbst-Attention-Mechanismen, um einen auffälligen SWin-Transformer-Backbone vorzuschlagen, gefolgt von einem Multi-Task-Lernansatz mit Aufmerksamkeits- und Texterkennungsköpfen. Dabei wird ein Informationsflussmechanismus vorgeschlagen, der beide Aufgaben zusätzlich unterstützt. Experimentelle Ergebnisse bestätigen die state-of-the-art-Leistungsfähigkeit unseres Ansatzes im E-Commerce-Kontext.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp