초록
시각 장면 내 주의의 초점을 이해하는 것은 시각 인지 및 컴퓨터 비전 분야에서 매우 중요한 문제이다. 본 논문에서는 주의의 초점을 중력장에 의해 영향을 받는 시스템으로 해석할 수 있는 변분법적 원리와 관련된 동적 과정으로서 스캔패스(eye movement trajectory)를 모델링한다. 눈의 움직임을 유도하는 분산된 가상 질량은 영상 내 세부 정보와 운동의 존재와 관련이 있다. 대부분의 기존 모델들과 달리, 제안하는 접근법은 직접적으로 자극성 지도(saliency map)를 추정하지 않으며, 대신 눈의 움직임을 예측함으로써 관심 영역의 시간적 누적을 통합할 수 있다. 또한, 고정(fixation)과 순간 이동(saccade)을 모사하기 위해 동적 모델 내에서 return 억제(inhibition-of-return) 메커니즘도 통합하였다. 제안된 모델의 운동 방정식은 수치적으로 적분되어 이미지 및 동영상 상에서 스캔패스를 시뮬레이션하는 데 사용된다. 다양한 데이터셋에서 자극성 예측 및 스캔패스 예측을 위한 실험 결과를 제시함으로써 이 이론을 뒷받침하며, 특히 본 모델의 주된 목적인 스캔패스 예측에서 최상의 성능을 달성하였다.