한 달 전

신경망에서 문맥에 따른 처리의 지속적 학습

Guanxiong Zeng; Yang Chen; Bo Cui; Shan Yu
신경망에서 문맥에 따른 처리의 지속적 학습
초록

깊은 신경망(딥 뉴럴 네트워크, DNNs)은 입력과 출력 사이의 복잡하지만 고정된 매핑 규칙을 학습하는 강력한 도구이지만, 이러한 특성 때문에 더 복잡하고 동적인 상황에서의 적용이 제한됩니다. 이는 매핑 규칙이 일관되지 않고 다양한 맥락에 따라 변화하기 때문입니다. 이러한 제한을 극복하기 위해, 우리는 새로운 접근 방식을 개발하였습니다. 이 접근 방식은 직교 가중치 수정(Orthogonal Weights Modification, OWM)이라는 학습 알고리즘과 맥락 종속 처리(Context-Dependent Processing, CDP) 모듈을 추가하여 구성되었습니다. 실험 결과, OWM을 통해 재앙적 잊어버림(catastrophic forgetting) 문제를 해결하고, CDP 모듈을 통해 다양한 맥락에서 특징 표현(feature representation)과 분류기(classifier)를 재사용하는 방법을 학습함으로써, 단일 네트워크가 온라인 및 지속적으로 수많은 맥락 종속 매핑 규칙을 10개 미만의 샘플로 각각 학습할 수 있음을 입증하였습니다. 이는 매우 컴팩트한 시스템이 실제 세계의 다양한 규칙성을 점진적으로 학습하고 결국 적절하게 행동할 수 있게 할 것입니다.

신경망에서 문맥에 따른 처리의 지속적 학습 | 최신 연구 논문 | HyperAI초신경