게임 속에서 생각하다

텐센트는 2025년 8월 Think-In-Games(TiG) 프레임워크를 제안했으며, 관련 연구 결과는 논문 "게임에서 생각하기: 대규모 언어 모델을 사용한 강화 학습을 통해 게임에서 추론하는 법 배우기".

TiG 프레임워크는 대규모 언어 모델(LLM)이 게임 환경과 직접 상호 작용하여 절차적 이해를 개발하는 동시에, 고유의 추론 및 설명 기능을 유지할 수 있도록 합니다. 특히, TiG는 강화 학습 기반 의사 결정을 언어 모델링 과제로 재구성합니다. LLM은 언어 기반 정책을 생성하고 환경 피드백 기반 온라인 강화 학습을 통해 이러한 정책을 반복적으로 최적화합니다. 이 프레임워크는 선언적 지식과 절차적 지식 간의 격차를 성공적으로 메워 기존 강화 학습 방식과 비교하여 경쟁력 있는 성능을 달성하는 동시에 데이터 및 연산 요구 사항을 크게 줄입니다.