2달 전
그래프 네트워크를 추론과 제어를 위한 학습 가능한 물리 엔진으로 활용
Alvaro Sanchez-Gonzalez; Nicolas Heess; Jost Tobias Springenberg; Josh Merel; Martin Riedmiller; Raia Hadsell; Peter Battaglia

초록
일상적인 물리적 장면을 이해하고 상호작용하기 위해서는 세계의 구조에 대한 풍부한 지식이 필요합니다. 이 지식은 가치 또는 정책 함수에서 암시적으로 또는 전환 모델에서 명시적으로 표현될 수 있습니다. 여기서 우리는 그래프 네트워크를 기반으로 하는 새로운 학습 가능한 모델 클래스를 소개합니다. 이 모델들은 복잡한 역동 시스템에 대한 객체 중심 및 관계 중심 표현에 대한 귀납적 편향을 구현합니다. 우리의 결과는, 실제 데이터와 시뮬레이션 데이터로부터 8개의 서로 다른 물리 시스템(매개변수적 및 구조적으로 변형된)에서 정확한 예측과 놀라울 정도로 강력하고 효율적인 일반화를 지원함을 보여줍니다. 또한, 우리의 추론 모델이 시스템 식별을 수행할 수 있음을 발견했습니다. 우리의 모델들은 미분 가능하며, 그래디언트 기반 궤도 최적화를 통해 온라인 계획을 지원하고 오프라인 정책 최적화도 가능합니다. 우리의 프레임워크는 세계에 대한 풍부한 지식을 활용하고 활용하는 새로운 기회를 제공하며, 인간처럼 세계를 표현하는 머신 개발의 중요한 단계를 밟고 있습니다.