9일 전

상상력을 통한 자기중심적 행동 예측 학습

Yu Wu, Linchao Zhu, Xiaohan Wang, Yi Yang, Fei Wu
상상력을 통한 자기중심적 행동 예측 학습
초록

실행되기 전에 행동을 예측하는 것은 자율 주행 및 로보틱스를 포함한 다양한 실용적 응용 분야에서 핵심적인 요소이다. 본 논문에서는 주관적 시점(egocentric) 동영상에서 향후 행동을 수행되기 몇 초 전에 예측하는 주관적 행동 예측 작업을 다룬다. 기존의 접근 방식은 관측된 내용을 요약하고 과거 관측 기반으로 향후 행동을 직접 예측하는 데 초점을 맞추고 있다. 우리는 관측되지 않은 프레임의 정보 부족을 보완할 수 있는 일부 단서를 탐색할 수 있다면 행동 예측 성능이 향상될 것이라고 믿는다. 이를 바탕으로 행동 예측을 향후 특징 예측의 연속적인 시퀀스로 분해하는 새로운 접근법을 제안한다. 우리는 가까운 미래에 시각적 특징이 어떻게 변화할지 상상하고, 그 상상된 표현 기반으로 향후 행동 레이블을 예측한다. 이와 달리, 우리의 ImagineRNN은 특징 회귀가 아니라 대조 학습(contrastive learning) 방식으로 최적화된다. ImagineRNN을 학습하기 위해 보조 작업(proxy task)을 활용하는데, 이는 방해 요소들 중에서 올바른 미래 상태를 선택하는 것이다. 또한, 인접 프레임 간의 특징 차이를 예측하는 것으로 목표를 변경함으로써 ImagineRNN의 성능을 더 향상시켰다. 이는 인접 프레임 특징 간의 차이가 미래 예측에 더 중요한 의미를 지닌다는 점을 고려한 것으로, 네트워크가 향후 행동이라는 핵심 목표에 더 집중하도록 유도한다. 두 개의 대규모 주관적 행동 데이터셋에 대한 광범위한 실험을 통해 제안한 방법의 유효성을 검증하였다. EPIC Kitchens 행동 예측 챌린지의 사전에 보인 테스트 세트와 사전에 보이지 않은 테스트 세트 모두에서 기존 방법들을 크게 능가하는 성능을 달성하였다.

상상력을 통한 자기중심적 행동 예측 학습 | 최신 연구 논문 | HyperAI초신경