9일 전
ETH-XGaze: 극단적인 헤드 포즈와 시선 변동 조건에서의 시선 추정을 위한 대규모 데이터셋
Xucong Zhang, Seonwook Park, Thabo Beeler, Derek Bradley, Siyu Tang, Otmar Hilliges

초록
시선 추정은 컴퓨터 비전, 인간-컴퓨터 상호작용, 로보틱스 등 다양한 분야에서 핵심적인 과제이다. 현재 많은 최첨단 방법들이 자체 개발한 데이터셋을 기반으로 학습 및 평가되며, 이로 인해 다양한 방법 간의 비교가 어려운 상황이다. 더불어 기존의 시선 추정 데이터셋은 머리 자세와 시선 방향의 변동 범위가 제한적이며, 평가 시 사용되는 프로토콜과 평가 지표 또한 상이하다. 본 논문에서는 극한의 머리 자세에서 다양한 시선을 포함한 100만 장 이상의 고해상도 이미지를 포함하는 새로운 시선 추정 데이터셋인 ETH-XGaze를 제안한다. 이 데이터셋은 110명의 참가자로부터, 18대의 디지털 SLR 카메라와 조절 가능한 조명 조건을 갖춘 맞춤형 하드웨어 시스템을 통해 수집되었으며, 정확한 지표 시선 위치를 기록하기 위한 캘리브레이션된 시스템을 사용하였다. 우리는 제안한 데이터셋이 다양한 머리 자세와 시선 각도에 걸쳐 시선 추정 방법의 견고성을 크게 향상시킬 수 있음을 보여준다. 또한, ETH-XGaze에서 표준화된 실험 프로토콜과 평가 지표를 정의함으로써, 향후 시선 추정 연구의 통일성을 높이고자 하였다. 데이터셋 및 벤치마크 웹사이트는 https://ait.ethz.ch/projects/2020/ETH-XGaze 에서 이용 가능하다.