Penser En Jeux
Le cadre Think-In-Games (TiG) a été proposé par Tencent en août 2025, et les résultats de recherche pertinents ont été publiés dans l'article «Penser en jeux : apprendre à raisonner en jeux grâce à l'apprentissage par renforcement avec de grands modèles linguistiques".
Le framework TiG permet aux grands modèles de langage (LLM) de développer une compréhension procédurale en interagissant directement avec l'environnement de jeu, tout en conservant leurs capacités inhérentes de raisonnement et d'explication. Plus précisément, TiG reformule la prise de décision par apprentissage par renforcement comme une tâche de modélisation du langage : les LLM génèrent des politiques guidées par le langage et les optimisent de manière itérative grâce à un apprentissage par renforcement en ligne basé sur les retours de l'environnement. Ce framework comble efficacement l'écart entre connaissances déclaratives et procédurales, obtenant des performances compétitives par rapport aux méthodes d'apprentissage par renforcement traditionnelles tout en réduisant considérablement les besoins en données et en calcul.