HyperAIHyperAI
vor 11 Tagen

RT-BENE: Ein Datensatz und Baselines für die Echtzeit-Blink-Schätzung in natürlichen Umgebungen

{Yiannis Demiris, Kévin Cortacero, Tobias Fischer}
RT-BENE: Ein Datensatz und Baselines für die Echtzeit-Blink-Schätzung in natürlichen Umgebungen
Abstract

In den letzten Jahren haben Methoden zur Blickrichtungsschätzung erhebliche Fortschritte gemacht, getrieben durch zahlreiche Anwendungsbereiche wie die Mensch-Roboter-Interaktion, die Schätzung visueller Aufmerksamkeit sowie die foveale Darstellung für virtuelle Realitätssysteme. Allerdings gehen viele gängige Ansätze zur Blickrichtungsschätzung typischerweise davon aus, dass die Augen des Subjekts geöffnet sind; bei geschlossenen Augen liefern diese Methoden unregelmäßige Schätzungen der Blickrichtung. Um diese Annahme zu adressieren, stellen wir zunächst ein neues, öffentlich zugängliches Datenset vor, das Annotationen zur Augenöffnung von mehr als 200.000 Augenbildern enthält, darunter über 10.000 Bilder mit geschlossenen Augen. Darüber hinaus präsentieren wir Baseline-Methoden, die die Erkennung von Blinzelvorgängen mittels konvolutioneller neuronalen Netze ermöglichen. In umfangreichen Experimenten zeigen wir, dass die vorgeschlagenen Baselines hinsichtlich Genauigkeit und Recall überzeugen. Wir integrieren unsere vorgeschlagenen RT-BENE-Baselines zudem in den kürzlich vorgestellten RT-GENE-Framework zur Blickrichtungsschätzung, wodurch eine Echtzeit-Schätzung der Augenöffnung ermöglicht wird. Wir argumentieren, dass unsere Arbeit sowohl die Blickrichtungsschätzung als auch die Blinzel-Erkennung voranbringt und einen Schritt in Richtung einer Vereinheitlichung beider Ansätze darstellt.

RT-BENE: Ein Datensatz und Baselines für die Echtzeit-Blink-Schätzung in natürlichen Umgebungen | Neueste Forschungsarbeiten | HyperAI