Command Palette
Search for a command to run...
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
Crystal Qian Kehang Zhu John Horton Benjamin S. Manning Vivian Tsai et al
概要
従来、人間が担っていた調整タスクが、ますます自律型エージェントに委ねられるようになっている。この傾向が進む中で、エージェントのパフォーマンスを評価するだけでなく、動的でマルチエージェント環境における交渉プロセスそのものも評価することが重要となる。さらに、異なるエージェントにはそれぞれ特徴的な強みがある。たとえば、ベイズモデルをはじめとする従来の統計的エージェントは、明確に定義された条件下では優れた性能を発揮する一方、大規模言語モデル(LLMs)は異なる文脈間で汎化する能力に優れている。本研究では、人間(N = 216)、LLM(GPT-4o、Gemini 1.5 Pro)、ベイズエージェントを、同一の動的交渉環境において直接比較することで、各集団間での同等条件での評価を可能にし、交渉の結果だけでなく、行動ダイナミクスも捉えている。ベイズエージェントは攻撃的な最適化によって最も高い余剰(surplus)を達成するが、その代償として取引の頻繁な拒否を生じる。一方、人間とLLMは同程度の総合的余剰を達成できるが、その行動様式は異なっている:LLMは保守的で譲歩を重視する取引を好む一方、取引拒否は少ないが、人間はより戦略的でリスクを取る行動、および公平性を重視する行動をとる。したがって、本研究では、エージェント評価の一般的なベンチマークである「パフォーマンスの同等性」が、プロセスや整合性(alignment)における根本的な相違を隠蔽している可能性があることを明らかにした。このような相違は、現実世界の調整タスクにおける実用的導入において極めて重要である。