ゲームで考える

Think-In-Games(TiG)フレームワークは、2025年8月にテンセントによって提案され、関連する研究結果が論文「ゲームで考える:大規模言語モデルを用いた強化学習によるゲームでの推論学習”。

TiGフレームワークは、大規模言語モデル(LLM)がゲーム環境と直接相互作用することで、本来の推論能力と説明能力を維持しながら、手続き的理解を発展させることを可能にします。具体的には、TiGは強化学習に基づく意思決定を言語モデリングタスクとして再定式化します。LLMは言語誘導ポリシーを生成し、環境フィードバックに基づくオンライン強化学習を通じてこれらのポリシーを反復的に最適化します。このフレームワークは、宣言的知識と手続き的知識のギャップをうまく埋め、従来の強化学習手法と比較して競争力のあるパフォーマンスを実現すると同時に、データと計算要件を大幅に削減します。