Les réseaux de graphes en tant que moteurs physiques apprenables pour l'inférence et le contrôle

Comprendre et interagir avec des scènes physiques quotidiennes nécessite une connaissance riche de la structure du monde, représentée soit implicitement dans une fonction de valeur ou de politique, soit explicitement dans un modèle de transition. Nous introduisons ici une nouvelle classe de modèles apprenables -- basés sur les réseaux de graphes -- qui mettent en œuvre un biais inductif pour des représentations centrées sur les objets et les relations de systèmes complexes et dynamiques. Nos résultats montrent que, en tant que modèle direct, notre approche permet des prédictions précises à partir de données réelles et simulées, ainsi qu'une généralisation remarquablement forte et efficace, à travers huit systèmes physiques distincts que nous avons variés paramétriquement et structurellement. Nous avons également constaté que notre modèle d'inférence peut effectuer l'identification du système. Nos modèles sont également dérivables et prennent en charge la planification en ligne via l'optimisation trajectoire basée sur les gradients, ainsi que l'optimisation hors ligne des politiques. Notre cadre offre de nouvelles opportunités pour exploiter une connaissance riche du monde et constitue une étape clé vers la construction de machines dotées de représentations plus humaines du monde.