새로운 게임을 활용한 기계의 적응형 세계 모델 평가

인간의 지능은 새로운 환경에서 빠르게 적응하고 효과적으로 문제를 해결하는 데 뛰어난 능력을 보여줍니다. 우리는 이러한 깊은 적응성이 환경에 대한 내부 표현, 즉 세계 모델을 효율적으로 구축하고 개선하는 것과 근본적으로 연결되어 있다고 주장합니다. 이를 우리는 세계 모델 유도(world model induction)라고 부릅니다. 그러나 현재 인공지능(AI)에서의 세계 모델에 대한 이해와 평가는 좁아, 대규모 데이터 코퍼스에서 학습된 정적인 표현에 집중되는 경우가 많습니다. 이는 새로운 환경에서 상호작용과 탐사를 통해 이러한 표현을 학습하는 모델의 효율성과 효과성을 고려하지 않는다는 점에서 한계가 있습니다. 본 논문에서는 인간이 어떻게 이렇게 효율적으로 학습하고 적응하는지를 연구한 인지과학의 수십 년간의 연구를 바탕으로 세계 모델 유도에 대한 관점을 제시합니다. 그런 다음, AI에서 적응형 세계 모델을 평가하기 위한 새로운 평가 체계를 요구합니다. 구체적으로, 기본 게임 구조에 진정한, 깊고 지속적으로 새로움을 제공하는 신중하게 설계된 게임들의 세트를 기반으로 하는 새로운 벤치마킹 패러다임을 제안합니다. 이러한 종류의 게임을 우리는 '새로운 게임(novel games)'이라고 부릅니다. 이러한 게임들을 구성하기 위한 주요 요구사항을 상세히 설명하고, 에이전트의 빠른 세계 모델 유도 능력을 명시적으로 도전하고 평가하기 위한 적절한 지표를 제안합니다. 우리는 이 새로운 평가 체계가 미래의 AI 세계 모델 평가 노력에 영감을 줄 것이며, 인간처럼 빠르게 적응하고 견고하게 일반화할 수 있는 AI 시스템 개발에 중요한 단계가 될 것으로 기대합니다. 이는 인공일반지능(AGI)의 핵심 요소입니다.