HyperAIHyperAI

Command Palette

Search for a command to run...

Gaze360: Physikalisch unbeschränkte Blickschätzung in freier Wildbahn

Petr Kellnhofer Adria Recasens Simon Stent Wojciech Matusik Antonio Torralba

Zusammenfassung

Die Erfassung von Blickrichtungen ist ein informativer sozialer Hinweis. In dieser Arbeit präsentieren wir Gaze360, einen großskaligen Datensatz und eine Methode für robuste 3D-Blickschätzung in unbeschränkten Bildern. Unser Datensatz umfasst 238 Probanden in Innen- und Außenräumen mit annotierten 3D-Blickrichtungen über eine breite Spanne von Kopfpositionen und Entfernungen. Er ist der größte öffentlich verfügbare Datensatz dieser Art sowohl hinsichtlich der Anzahl der Probanden als auch der Vielfalt, was durch eine einfache und effiziente Datensammlungsmethode ermöglicht wurde. Das vorgeschlagene 3D-Blickmodell erweitert bestehende Ansätze um zeitliche Informationen und ermöglicht die direkte Ausgabe einer Schätzung der Blickunsicherheit. Wir zeigen die Vorteile unseres Modells anhand einer Ablationsstudie und demonstrieren seine Generalisierungsfähigkeit durch eine Kreuz-Datensatz-Evaluation gegenüber anderen aktuellen Benchmark-Datensätzen für Blickverfolgung. Zudem schlagen wir einen einfachen selbstüberwachten Ansatz zur Verbesserung der Domänenanpassung zwischen Datensätzen vor. Schließlich zeigen wir eine Anwendung unseres Modells zur Schätzung der Aufmerksamkeit von Kunden in einer Supermarktsituation. Unser Datensatz und die Modelle sind unter http://gaze360.csail.mit.edu verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp