HyperAIHyperAI
vor 9 Tagen

ETH-XGaze: Ein großes Datenset für die Blickschätzung unter extremen Kopfpositionen und Blickvariationen

Xucong Zhang, Seonwook Park, Thabo Beeler, Derek Bradley, Siyu Tang, Otmar Hilliges
ETH-XGaze: Ein großes Datenset für die Blickschätzung unter extremen Kopfpositionen und Blickvariationen
Abstract

Die Gaze-Schätzung ist eine grundlegende Aufgabe in vielen Anwendungen des Computersehens, der Mensch-Computer-Interaktion und der Robotik. Viele aktuelle Methoden werden auf individuellen Datensätzen trainiert und getestet, was den Vergleich zwischen verschiedenen Ansätzen erschwert. Zudem besitzen bestehende Gaze-Schätzungsdatensätze begrenzte Variationen in Kopfpose und Blickrichtung, und die Evaluierungen erfolgen mit unterschiedlichen Protokollen und Metriken. In diesem Paper stellen wir einen neuen Gaze-Schätzungsdatensatz namens ETH-XGaze vor, der über eine Million hochauflösender Bilder mit variierender Blickrichtung unter extremen Kopfpositionen umfasst. Dieser Datensatz wurde von 110 Probanden mit einer maßgeschneiderten Hardware-Ausstattung erfasst, die aus 18 digitalen Spiegelreflexkameras und einstellbaren Beleuchtungsbedingungen sowie einem kalibrierten System zur Aufzeichnung der wahren Gaze-Ziele besteht. Wir zeigen, dass unser Datensatz die Robustheit von Gaze-Schätzungsmethoden gegenüber unterschiedlichen Kopfpositionen und Blickwinkeln erheblich verbessern kann. Darüber hinaus definieren wir ein standardisiertes experimentelles Protokoll und eine Evaluationsmetrik auf ETH-XGaze, um die Forschung im Bereich der Gaze-Schätzung zukünftig besser zu vereinheitlichen. Der Datensatz und die Benchmark-Website sind unter https://ait.ethz.ch/projects/2020/ETH-XGaze verfügbar.

ETH-XGaze: Ein großes Datenset für die Blickschätzung unter extremen Kopfpositionen und Blickvariationen | Neueste Forschungsarbeiten | HyperAI