RITnet: Echtzeit-Semantische Segmentierung des Auges für Blickverfolgung

Genauere Augensegmentierung kann die Blickrichtungsschätzung verbessern und interaktive Computing-Anwendungen auf Basis visueller Aufmerksamkeit unterstützen; bestehende Methoden zur Augensegmentierung leiden jedoch unter Problemen wie personenspezifischer Genauigkeit, geringer Robustheit und Unfähigkeit, in Echtzeit ausgeführt zu werden. Hier präsentieren wir das RITnet-Modell, ein tiefes neuronales Netzwerk, das U-Net und DenseNet kombiniert. RITnet hat eine Größe von unter 1 MB und erreicht eine Genauigkeit von 95,3 % beim Semantic Segmentation Challenge des OpenEDS 2019. Mit einer GeForce GTX 1080 Ti erreicht RITnet eine Tracking-Geschwindigkeit von über 300 Hz, was Echtzeit-Anwendungen zur Blickverfolgung ermöglicht. Vorgebildete Modelle und der Quellcode sind verfügbar unter https://bitbucket.org/eye-ush/ritnet/.