HyperAIHyperAI
il y a 2 mois

Création de dispositions hiérarchiques des besoins dans un agent

Tofara Moyo
Résumé

Nous présentons une nouvelle méthode pour l'apprentissage d'abstractions hiérarchiques qui priorisent des objectifs concurrents, conduisant à une amélioration des récompenses attendues globales. Notre approche utilise un agent de récompense secondaire avec plusieurs sorties scalaires, chacune associée à un niveau d'abstraction distinct. L'agent traditionnel apprend ensuite à maximiser ces sorties de manière hiérarchique, en conditionnant chaque niveau sur la maximisation du niveau précédent. Nous dérivons une équation qui ordonne ces valeurs scalaires et la récompense globale par priorité, induisant une hiérarchie de besoins qui guide la formation des objectifs. Les résultats expérimentaux sur l'environnement Pendulum v1 montrent une performance supérieure par rapport à une implémentation de base. Nous avons obtenu des résultats de pointe dans ce domaine.