한 달 전
진보적인 신경망
Andrei A. Rusu; Neil C. Rabinowitz; Guillaume Desjardins; Hubert Soyer; James Kirkpatrick; Koray Kavukcuoglu; Razvan Pascanu; Raia Hadsell

초록
복잡한 작업 시퀀스를 해결하는 것--이전 학습을 활용하면서 재앙적 잊힘(catastrophic forgetting)을 피하는 것--은 인간 수준의 지능을 달성하는 데 있어 주요 장애물로 남아 있습니다. 프로그레시브 네트워크 접근법은 이 방향으로 한 걸음을 내딛는 것을 나타냅니다: 이들은 잊힘에 면역이며, 이전에 학습된 특징들 사이의 횡단 연결(lateral connections)을 통해 이전 지식을 활용할 수 있습니다. 우리는 이 아키텍처를 아타리 게임과 3D 미로 게임 등 다양한 강화학습 작업에서 폭넓게 평가하였으며, 사전 학습(pretraining) 및 미세 조정(finetuning) 기반의 일반적인 베이스라인보다 우수한 성능을 보임을 입증하였습니다. 새로운 민감도 측정 방법을 사용하여, 전이(transfer)가 학습된 정책의 저수준 감각층과 고수준 제어층 모두에서 발생함을 보여주었습니다.