2ヶ月前

テキストベースの常識知識を持つRLエージェント:新しい課題、環境、およびベースライン

Keerthiram Murugesan; Mattia Atzeni; Pavan Kapanipathi; Pushkar Shukla; Sadhana Kumaravel; Gerald Tesauro; Kartik Talamadupula; Mrinmaya Sachan; Murray Campbell
テキストベースの常識知識を持つRLエージェント:新しい課題、環境、およびベースライン
要約

テキストベースのゲームは、強化学習(Reinforcement Learning: RL)研究における重要なテストベッドとして注目を集めています。これらのゲームでは、RLエージェントが言語理解と逐次的な意思決定を組み合わせる必要があります。本論文では、RLエージェントに常識知識を注入する問題について検討します。このような知識は、エージェントが非現実的な行動を排除することで効率的に世界で行動し、また先行計画を行うことで現在の行動が将来の世界状態にどのように影響を与えるかを判断することを可能にします。私たちは、オブジェクト、その属性、および操作可能性に関する特定の種類の常識知識を持つRLエージェントの訓練と評価のために、新しいテキストベースのゲーム環境「TextWorld Commonsense (TWC)」を設計しました。さらに、逐次的なコンテクストを追跡し、ConceptNetから関連する常識知識を動的に取得するいくつかの基準となるRLエージェントを導入します。実験結果から、TWCにおいて常識知識を取り入れたエージェントがより効率的に行動しつつもパフォーマンスが向上することが示されました。また、ユーザー調査を通じて人間のTWCでのパフォーマンスを推定し、今後の改善余地があることを示しています。

テキストベースの常識知識を持つRLエージェント:新しい課題、環境、およびベースライン | 最新論文 | HyperAI超神経