11일 전

장기 시각적 동역학 학습을 위한 영역 제안 상호작용 네트워크

Haozhi Qi, Xiaolong Wang, Deepak Pathak, Yi Ma, Jitendra Malik
장기 시각적 동역학 학습을 위한 영역 제안 상호작용 네트워크
초록

장기적 동역학 모델 학습은 물리적 일반지식을 이해하는 데 핵심적인 과제이다. 기존의 시각 입력에서 동역학을 학습하는 대부분의 방법들은 단기 모델을 활용해 빠른 재계획(re-planning)을 통해 장기 예측을 회피한다. 그러나 이는 모델의 정확도가 극도로 높아야 하며, 에이전트가 작업 완료 시점까지 매 단계마다 지속적으로 피드백을 받고 행동할 수 있는 환경에서만 적용 가능하다는 한계를 가진다. 본 논문에서는 시각 인식 과제에서 성공한 사례들을 활용하여, 장거리에 걸쳐 개체 간 상호작용과 개체-환경 상호작용을 포착할 수 있는 개체 표현을 구축하고자 한다. 이를 위해 우리는 잠재적 영역 제안 특징 공간에서 각 개체의 궤적을 추론하는 영역 제안 상호작용 네트워크(Region Proposal Interaction Networks, RPIN)를 제안한다. 간단하면서도 효과적인 개체 표현 덕분에, 본 방법은 예측 정확도와 하류 작업 계획 능력 측면에서 기존 방법들을 크게 능가하며, 새로운 환경에 대해서도 우수한 일반화 성능을 보인다. 코드, 사전 학습된 모델, 추가 시각화 결과는 https://haozhi.io/RPIN 에서 확인할 수 있다.

장기 시각적 동역학 학습을 위한 영역 제안 상호작용 네트워크 | 최신 연구 논문 | HyperAI초신경