HyperAIHyperAI

Command Palette

Search for a command to run...

Création de dispositions hiérarchiques des besoins dans un agent

Tofara Moyo

Résumé

Nous présentons une nouvelle méthode pour l'apprentissage d'abstractions hiérarchiques qui priorisent des objectifs concurrents, conduisant à une amélioration des récompenses attendues globales. Notre approche utilise un agent de récompense secondaire avec plusieurs sorties scalaires, chacune associée à un niveau d'abstraction distinct. L'agent traditionnel apprend ensuite à maximiser ces sorties de manière hiérarchique, en conditionnant chaque niveau sur la maximisation du niveau précédent. Nous dérivons une équation qui ordonne ces valeurs scalaires et la récompense globale par priorité, induisant une hiérarchie de besoins qui guide la formation des objectifs. Les résultats expérimentaux sur l'environnement Pendulum v1 montrent une performance supérieure par rapport à une implémentation de base. Nous avons obtenu des résultats de pointe dans ce domaine.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Création de dispositions hiérarchiques des besoins dans un agent | Articles | HyperAI