Command Palette

Search for a command to run...

7일 전

신뢰하기를 배우기: 순차적 의사결정에서 제안자 신뢰성의 변화에 대한 베이지안 적응

Dylan M. Asmar Mykel J. Kochenderfer

신뢰하기를 배우기: 순차적 의사결정에서 제안자 신뢰성의 변화에 대한 베이지안 적응

초록

불확실한 환경에서 순차적 결정 과제를 수행하는 자율 에이전트는 외부의 행동 제안을 통해 큰 이익을 볼 수 있다. 이러한 제안은 유용한 안내를 제공하지만, 본질적으로 신뢰도가 다양하다. 기존의 제안을 통합하는 방법들은 제안자의 품질 파라미터가 정적이고 사전에 알려져 있다고 가정하는 경우가 많아 실용적 적용에 한계가 있다. 본 연구에서는 부분 관측 환경에서 제안자의 신뢰도가 변하는 상황에 동적으로 학습하고 적응할 수 있는 프레임워크를 제안한다. 첫째, 제안자의 품질을 에이전트의 믿음 표현( belief representation)에 직접 통합함으로써, 에이전트가 제안자의 유형에 대한 베이지안 추론을 통해 제안에 대한 신뢰도를 추론하고 조정할 수 있도록 한다. 둘째, 에이전트가 중요한 시점에 전략적으로 제안을 요청할 수 있도록 '요청(ask)'이라는 명시적 행동을 도입함으로써, 정보적 이득과 제안 획득 비용 사이의 균형을 조절할 수 있도록 한다. 실험 평가를 통해 다양한 제안자 품질 상황에서 견고한 성능을 보였으며, 신뢰도 변화에 적응하고 제안 요청을 전략적으로 관리하는 능력을 입증하였다. 본 연구는 불확실한 환경에서 제안의 불확실성을 다루는 방식으로, 적응형 인간-에이전트 협업의 기반을 마련한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
신뢰하기를 배우기: 순차적 의사결정에서 제안자 신뢰성의 변화에 대한 베이지안 적응 | 연구 논문 | HyperAI초신경