HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 7 jours

Apprendre à faire confiance : adaptation bayésienne à la fiabilité variable du suggesteur dans la prise de décision séquentielle

Dylan M. Asmar Mykel J. Kochenderfer

Apprendre à faire confiance : adaptation bayésienne à la fiabilité variable du suggesteur dans la prise de décision séquentielle

Résumé

Les agents autonomes opérant dans des tâches de prise de décision séquentielle en situation d’incertitude peuvent tirer parti de suggestions d’action externes, qui offrent une orientation précieuse mais présentent inévitablement une fiabilité variable. Les méthodes existantes pour intégrer de telles suggestions supposent généralement que les paramètres de qualité du suggesteur sont statiques et connus, ce qui limite leur déploiement pratique. Nous proposons un cadre permettant d’apprendre dynamiquement et de s’adapter à la fiabilité variable du suggesteur dans des environnements partiellement observables. Premièrement, nous intégrons directement la qualité du suggesteur dans la représentation de croyance de l’agent, permettant à celui-ci d’inférer et d’ajuster son niveau de confiance dans les suggestions par inférence bayésienne sur les types de suggesteurs. Deuxièmement, nous introduisons une action explicite « demander », permettant à l’agent de solliciter stratégiquement des suggestions aux moments critiques, en équilibrant les gains d’information contre les coûts d’acquisition. Une évaluation expérimentale démontre une performance robuste face à des qualités de suggesteur variables, une adaptation à des changements de fiabilité, ainsi qu’une gestion stratégique des demandes de suggestions. Ce travail établit une base pour une collaboration homme-agent adaptative en abordant l’incertitude liée aux suggestions dans des environnements incertains.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Apprendre à faire confiance : adaptation bayésienne à la fiabilité variable du suggesteur dans la prise de décision séquentielle | Articles de recherche | HyperAI