1ヶ月前
新しいゲームを用いた機械の適応的な世界モデルの評価
Lance Ying, Katherine M. Collins, Prafull Sharma, Cedric Colas, Kaiya Ivy Zhao, Adrian Weller, et al

要約
人間の知能は、未知かつ不慣れな状況において迅速な適応と効果的な問題解決を示す驚異的な能力を持っています。私たちは、この深い適応性が環境の内部表現(一般的に世界モデルと呼ばれます)の効率的な構築と洗練に根本的に結びついていると考えています。この適応メカニズムを世界モデル誘導と呼びます。しかし、現在の人工知能(AI)における世界モデルの理解と評価は狭く、大量のデータから学習した静的な表現に焦点を当てることが多く、新しい環境での相互作用や探求を通じてこれらの表現を学ぶ効率性や有効性には十分な注意が払われていません。 本稿では、認知科学における数十年にわたる研究に基づいて、人間がどのように効率的に学習し適応するかについての視点から世界モデル誘導について考察します。そして、AIにおける適応型世界モデルを評価する新しいフレームワークを求めます。具体的には、ゲーム構造に本物の深さと継続的な新鮮さを持つ慎重に設計された一連のゲームに基づく新しいベンチマークパラダイムを提案します。このようなゲームを新規ゲームと呼びます。これらのゲームを作成する際の重要な要件を詳細に説明し、エージェントが迅速な世界モデル誘導を行う能力を明確に挑戦し評価するための適切な指標を提案します。 私たちは、この新しい評価フレームワークが未来のAIにおける世界モデル評価への取り組みを刺激し、人間のような迅速な適応能力和頑健な汎化能力を持つAIシステムを開発する上で重要な一歩となることを期待しています。これは人工一般知能にとって不可欠な要素です。