HyperAIHyperAI

Command Palette

Search for a command to run...

Agent-gesteuertes Netzbild zur Blickschätzung durch die Erkundung der Zwei-Auge-Asymmetrie

Nan Su Guijin Wang Wenming Yang Feifei Zhang Yichen Shi

Zusammenfassung

Die Schätzung des Blickrichtungsverhaltens ist eine zentrale Aufgabe zur Verständnis menschlicher visueller Aufmerksamkeit. Trotz der durch jüngste algorithmische Fortschritte erzielten Leistungssteigerungen bleibt die Aufgabe herausfordernd, bedingt durch die zweiohrige Erscheinungsasymmetrie, die durch Veränderungen der Kopfhaltung und nicht gleichmäßige Beleuchtung entsteht. In diesem Artikel stellen wir eine neuartige Architektur, das Agent-guided Gaze Estimation Network (AGE-Net), vor, um zweiohrige Merkmale vollständig und effizient zu nutzen. Durch die Exploration der Erscheinungsasymmetrie und der daraus resultierenden Asymmetrie im Merkmalsraum entwickeln wir einen Hauptzweig sowie zwei Agenten-Regressionsaufgaben. Der Hauptzweig extrahiert relevante Merkmale der linken und rechten Augen aus niedrigstufigen Semantiken. Gleichzeitig extrahieren die Agenten-Regressionsaufgaben asymmetrische Merkmale der linken und rechten Augen aus hochstufigen Semantiken, um den Hauptzweig dabei zu unterstützen, einen tieferen Einblick in den Augenmerkmalsraum zu gewinnen. Experimente zeigen, dass unsere Methode sowohl auf den MPIIGaze- als auch auf den EyeDiap-Datenbanken die derzeit beste Leistung bei der Blickrichtungsschätzung erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp