在游戏中思考框架 Think-In-Games
Think-In-Games(TiG)框架是由腾讯于 2025 年 8 月提出的,相关研究成果发表于论文「Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models」。
TiG 框架够使大语言模型(LLMs)通过直接与游戏环境交互来发展程序性理解,同时保留其固有的推理和解释能力。 具体而言,TiG 将基于强化学习的决策制定重新表述为语言建模任务:LLMs 生成语言指导策略,并通过基于环境反馈的在线强化学习迭代优化这些策略。该框架成功弥合了陈述性知识与程序性知识之间的差距,相较于传统 RL 方法,在显著降低数据与计算需求的同时实现了具有竞争力的性能。