HyperAIHyperAI

Command Palette

Search for a command to run...

Apprendre à faire confiance : adaptation bayésienne à la fiabilité variable du suggesteur dans la prise de décision séquentielle

Dylan M. Asmar Mykel J. Kochenderfer

Résumé

Les agents autonomes opérant dans des tâches de prise de décision séquentielle en situation d’incertitude peuvent tirer parti de suggestions d’action externes, qui offrent une orientation précieuse mais présentent inévitablement une fiabilité variable. Les méthodes existantes pour intégrer de telles suggestions supposent généralement que les paramètres de qualité du suggesteur sont statiques et connus, ce qui limite leur déploiement pratique. Nous proposons un cadre permettant d’apprendre dynamiquement et de s’adapter à la fiabilité variable du suggesteur dans des environnements partiellement observables. Premièrement, nous intégrons directement la qualité du suggesteur dans la représentation de croyance de l’agent, permettant à celui-ci d’inférer et d’ajuster son niveau de confiance dans les suggestions par inférence bayésienne sur les types de suggesteurs. Deuxièmement, nous introduisons une action explicite « demander », permettant à l’agent de solliciter stratégiquement des suggestions aux moments critiques, en équilibrant les gains d’information contre les coûts d’acquisition. Une évaluation expérimentale démontre une performance robuste face à des qualités de suggesteur variables, une adaptation à des changements de fiabilité, ainsi qu’une gestion stratégique des demandes de suggestions. Ce travail établit une base pour une collaboration homme-agent adaptative en abordant l’incertitude liée aux suggestions dans des environnements incertains.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp