Une machine avec des systèmes de mémoire à court terme, épisodique et sémantique

Inspirationnée par la théorie des systèmes de mémoire explicite en sciences cognitives, nous avons modélisé un agent doté de systèmes de mémoire à court terme, épisodique et sémantique, chacun représenté par un graphe de connaissances. Pour évaluer ce système et analyser le comportement de cet agent, nous avons conçu et mis en ligne notre propre environnement d'apprentissage par renforcement pour les agents, intitulé « la Salle », où l'agent doit apprendre comment encoder, stocker et récupérer des souvenirs afin d'optimiser son rendement en répondant à des questions. Nous démontrons que notre agent basé sur l'apprentissage profond Q réussit à apprendre quand une mémoire à court terme doit être oubliée ou plutôt stockée dans les systèmes de mémoire épisodique ou sémantique. Nos expériences indiquent qu'un agent équipé de systèmes de mémoire similaires à ceux des humains peut surpasser un agent dépourvu de cette structure mémorielle dans l'environnement.