17일 전
당신은 단 하나의 표현만을 학습합니다: 다중 작업을 위한 통합 네트워크
Chien-Yao Wang, I-Hau Yeh, Hong-Yuan Mark Liao

초록
사람들은 시각, 청각, 촉각뿐만 아니라 과거 경험을 통해 세상을 ‘이해’한다. 인간의 경험은 정규 학습을 통해 습득할 수 있으며(우리는 이를 명시적 지식이라고 부른다), 또는 무의식적으로도 습득할 수 있다(우리는 이를 암묵적 지식이라 부른다). 이러한 정규 학습 또는 무의식적 학습을 통해 얻은 경험들은 뇌에 인코딩되어 저장된다. 이러한 풍부한 경험을 거대한 데이터베이스로 활용함으로써, 인간은 미리 접해보지 않은 데이터도 효과적으로 처리할 수 있다. 본 논문에서는 인간 뇌가 정규 학습과 무의식적 학습을 통해 지식을 습득하는 방식과 유사하게, 암묵적 지식과 명시적 지식을 함께 인코딩할 수 있는 통합 네트워크를 제안한다. 이 통합 네트워크는 다양한 작업에 동시에 활용할 수 있는 통합된 표현을 생성할 수 있다. 우리는 컨볼루션 신경망 내에서 커널 공간 정렬(kernel space alignment), 예측 정밀화(prediction refinement), 다중 작업 학습(multi-task learning)을 수행할 수 있다. 실험 결과, 암묵적 지식을 신경망에 도입할 경우, 모든 작업의 성능이 향상됨을 확인할 수 있었다. 또한 제안한 통합 네트워크로부터 학습된 암묵적 표현을 추가적으로 분석한 결과, 다양한 작업의 물리적 의미를 효과적으로 포착하는 뛰어난 능력을 보였다. 본 연구의 소스 코드는 다음 링크에서 확인할 수 있다: https://github.com/WongKinYiu/yolor.