17일 전

지속 가능한 자기지도 학습을 향하여

Shanghua Gao, Pan Zhou, Ming-Ming Cheng, Shuicheng Yan
지속 가능한 자기지도 학습을 향하여
초록

비록 점점 더 많은 학습 비용이 소요되지만, 대부분의 자기지도학습(self-supervised learning, SSL) 모델은 최종 작업에 활용되는 최상위 성능(SOTA) 모델이 몇몇에 불과하기 때문에, 종종 처음부터 다시 반복적으로 학습되며 완전히 활용되지 않고 있다. 본 연구에서는 두 가지 주요 도전 과제를 해결하는 지속 가능한 SSL 프레임워크를 탐구한다: i) 기존의 사전 학습된 SSL 모델(또는 '베이스' 모델이라 불림)을 기반으로 비용 효율적인 방식으로 더 강력한 새로운 SSL 모델을 학습하는 것, ii) 새로운 모델의 학습이 다양한 베이스 모델과 호환되도록 하는 것. 우리는 기존 마스크 재구성 기반 SSL에 두 가지 구성 요소를 도입하는 타겟 강화 조건부(Target-Enhanced Conditional, TEC) 방식을 제안한다. 먼저, 패치 관계 강화 타겟을 제안하여 베이스 모델이 제공하는 타겟을 강화하고, 불완전한 입력을 이용해 새로운 모델이 베이스 모델로부터 의미적 관계 지식을 학습하도록 유도한다. 이러한 타겟 강화와 강화는 입력이 불완전할 경우에도 추가적인 패치 관계 모델링을 강제함으로써 새로운 모델이 베이스 모델을 넘어서는 데 기여한다. 두 번째로, 다양한 베이스 모델의 타겟과 일치하도록 새로운 모델의 예측을 적응적으로 조정하는 조건부 어댑터(conditionally adapter)를 도입한다. 광범위한 실험 결과는 TEC 방식이 학습 속도를 가속화할 뿐만 아니라, MAE 및 iBOT과 같은 최상위 성능 SSL 베이스 모델을 개선함으로써 지속 가능한 SSL을 향한 탐색적 진전을 이루었다는 것을 보여준다.

지속 가능한 자기지도 학습을 향하여 | 최신 연구 논문 | HyperAI초신경