11일 전
역학 인지 모델을 활용한 물리적 추론
Eltayeb Ahmed, Anton Bakhtin, Laurens van der Maaten, Rohit Girdhar

초록
물리적 추론 과제를 해결하는 일반적인 접근 방식은 예시 과제에 대해 값 학습기(value learner)를 훈련하는 것이다. 이러한 접근 방식의 한계는 환경의 롤아웃(final state)에 할당된 보상 값만을 통해 물체의 역학(dynamics)에 대해 학습해야 한다는 점이다. 본 연구는 이러한 한계를 극복하기 위해 보상 값을 물체 역학에 관한 자기지도(self-supervised) 신호로 보완하고자 한다. 구체적으로, 추론 과제의 결과를 예측하는 것과 함께, 두 환경 롤아웃 간의 유사도를 모델이 특성화하도록 훈련한다. 이 유사도는 두 롤아웃에서 물체의 궤적 간의 거리 측도로 정의할 수 있으며, 또는 대조적(contrastive) 형식을 사용하여 픽셀에서 직접 학습할 수도 있다. 실험적으로 우리는 이러한 방법이 물리적 추론을 평가하는 PHYRE 벤치마크(Bakhtin 등, 2019)에서 상당한 성능 향상을 가져오며, 새로운 최고 성능(state-of-the-art)을 확립함을 확인하였다.