2달 전
일반적인 에이전트
Scott Reed; Konrad Zolna; Emilio Parisotto; Sergio Gomez Colmenarejo; Alexander Novikov; Gabriel Barth-Maron; Mai Gimenez; Yury Sulsky; Jackie Kay; Jost Tobias Springenberg; Tom Eccles; Jake Bruce; Ali Razavi; Ashley Edwards; Nicolas Heess; Yutian Chen; Raia Hadsell; Oriol Vinyals; Mahyar Bordbar; Nando de Freitas

초록
대규모 언어 모델링의 발전에 영감을 받아, 우리는 텍스트 출력 범위를 넘어서 단일 일반 에이전트를 구축하기 위한 유사한 접근 방식을 적용하였습니다. 이 에이전트는 Gato라고 지칭하며, 다중 모드(multi-modal), 다중 작업(multi-task), 다중 실체(multi-embodiment) 일반 정책으로 작동합니다. 동일한 네트워크와 동일한 가중치로 Atari 게임을 플레이하고, 이미지 캡션 생성, 대화, 실제 로봇 팔로 블록 쌓기 등 다양한 작업을 수행할 수 있으며, 상황에 따라 텍스트, 관절 토크, 버튼 누름 또는 기타 토큰 중 어떤 것을 출력할지 결정합니다. 본 보고서에서는 Gato의 모델과 데이터를 설명하고 현재 기능을 문서화하였습니다.