HyperAI

Résumé

Les agents autonomes opérant dans des tâches de prise de décision séquentielle en situation d’incertitude peuvent tirer parti de suggestions d’action externes, qui offrent une orientation précieuse mais présentent inévitablement une fiabilité variable. Les méthodes existantes pour intégrer de telles suggestions supposent généralement que les paramètres de qualité du suggesteur sont statiques et connus, ce qui limite leur déploiement pratique. Nous proposons un cadre permettant d’apprendre dynamiquement et de s’adapter à la fiabilité variable du suggesteur dans des environnements partiellement observables. Premièrement, nous intégrons directement la qualité du suggesteur dans la représentation de croyance de l’agent, permettant à celui-ci d’inférer et d’ajuster son niveau de confiance dans les suggestions par inférence bayésienne sur les types de suggesteurs. Deuxièmement, nous introduisons une action explicite « demander », permettant à l’agent de solliciter stratégiquement des suggestions aux moments critiques, en équilibrant les gains d’information contre les coûts d’acquisition. Une évaluation expérimentale démontre une performance robuste face à des qualités de suggesteur variables, une adaptation à des changements de fiabilité, ainsi qu’une gestion stratégique des demandes de suggestions. Ce travail établit une base pour une collaboration homme-agent adaptative en abordant l’incertitude liée aux suggestions dans des environnements incertains.

Apprendre à faire confiance : adaptation bayésienne à la fiabilité variable du suggesteur dans la prise de décision séquentielle

Dylan M. Asmar Mykel J. Kochenderfer

Résumé

Construire l'IA avec l'IA

Hyper Newsletters

Command Palette

Apprendre à faire confiance : adaptation bayésienne à la fiabilité variable du suggesteur dans la prise de décision séquentielle

Dylan M. Asmar Mykel J. Kochenderfer

Résumé

Construire l'IA avec l'IA

Hyper Newsletters