9 天前
ETH-XGaze:一种用于极端头部姿态与 gaze 变化下的注视估计的大规模数据集
Xucong Zhang, Seonwook Park, Thabo Beeler, Derek Bradley, Siyu Tang, Otmar Hilliges

摘要
视线估计是计算机视觉、人机交互以及机器人技术等多个领域中的基础性任务。当前许多先进的视线估计方法均在特定自定义数据集上进行训练与测试,导致不同方法之间的性能比较面临困难。此外,现有视线估计数据集在头部姿态和视线方向的多样性方面较为有限,且评估通常采用不同的实验协议和评价指标,进一步加剧了研究的不一致性。本文提出一种新型视线估计数据集——ETH-XGaze,包含超过一百万张高分辨率图像,覆盖极端头部姿态下的多样化视线情况。该数据集由110名参与者在自研硬件系统下采集,系统配备18台数码单反相机、可调节光照条件,并集成校准系统以精确记录真实视线目标。实验结果表明,该数据集能够显著提升视线估计方法在不同头部姿态和视线角度下的鲁棒性。此外,本文在ETH-XGaze数据集上定义了一套标准化的实验协议与评价指标,旨在推动视线估计研究的规范化与可比性。相关数据集及基准测试网站已公开,访问地址为:https://ait.ethz.ch/projects/2020/ETH-XGaze