11일 전

역학 인지 모델을 활용한 물리적 추론

Eltayeb Ahmed, Anton Bakhtin, Laurens van der Maaten, Rohit Girdhar
역학 인지 모델을 활용한 물리적 추론
초록

물리적 추론 과제를 해결하는 일반적인 접근 방식은 예시 과제에 대해 값 학습기(value learner)를 훈련하는 것이다. 이러한 접근 방식의 한계는 환경의 롤아웃(final state)에 할당된 보상 값만을 통해 물체의 역학(dynamics)에 대해 학습해야 한다는 점이다. 본 연구는 이러한 한계를 극복하기 위해 보상 값을 물체 역학에 관한 자기지도(self-supervised) 신호로 보완하고자 한다. 구체적으로, 추론 과제의 결과를 예측하는 것과 함께, 두 환경 롤아웃 간의 유사도를 모델이 특성화하도록 훈련한다. 이 유사도는 두 롤아웃에서 물체의 궤적 간의 거리 측도로 정의할 수 있으며, 또는 대조적(contrastive) 형식을 사용하여 픽셀에서 직접 학습할 수도 있다. 실험적으로 우리는 이러한 방법이 물리적 추론을 평가하는 PHYRE 벤치마크(Bakhtin 등, 2019)에서 상당한 성능 향상을 가져오며, 새로운 최고 성능(state-of-the-art)을 확립함을 확인하였다.

역학 인지 모델을 활용한 물리적 추론 | 최신 연구 논문 | HyperAI초신경