9日前

ETH-XGaze:極端なヘッドポーズおよび視線変動下における視線推定のための大規模データセット

Xucong Zhang, Seonwook Park, Thabo Beeler, Derek Bradley, Siyu Tang, Otmar Hilliges
ETH-XGaze:極端なヘッドポーズおよび視線変動下における視線推定のための大規模データセット
要約

視線推定は、コンピュータビジョン、人間-コンピュータインタラクション、ロボティクスなどの多くの応用分野において基盤的なタスクである。現在の最先端手法の多くは、独自のデータセット上で学習・評価が行われており、手法間の比較が困難な状況にある。さらに、既存の視線推定データセットは、頭部ポーズや視線方向の変動が限定的であり、評価プロトコルや評価指標も一貫性に欠ける。本論文では、極端な頭部ポーズ下での多様な視線を含む、100万枚を超える高解像度画像から構成される新たな視線推定データセット「ETH-XGaze」を提案する。このデータセットは、110名の被験者を対象に、18台のデジタルSLRカメラと調整可能な照明条件を備えた独自のハードウェアセットを用いて収集し、正確な真値視線目標を記録可能なキャリブレーション済みシステムを導入している。我々は、本データセットを用いることで、異なる頭部ポーズや視線角度にわたる視線推定手法のロバスト性が著しく向上することを示す。さらに、ETH-XGaze上で標準化された実験プロトコルおよび評価指標を定義し、今後の視線推定研究の統一を図る。データセットおよびベンチマークウェブサイトは、https://ait.ethz.ch/projects/2020/ETH-XGaze にて公開されている。

ETH-XGaze:極端なヘッドポーズおよび視線変動下における視線推定のための大規模データセット | 最新論文 | HyperAI超神経