17일 전

임플리시트 기울기를 이용한 메타학습

Aravind Rajeswaran, Chelsea Finn, Sham Kakade, Sergey Levine
임플리시트 기울기를 이용한 메타학습
초록

지능 시스템의 핵심 능력 중 하나는 과거 경험을 활용해 새로운 작업을 빠르게 학습하는 능력이다. 최근, 적은 샘플 데이터를 기반으로 한 학습(few-shot learning)에 효과적인 접근법으로 기울기(또는 최적화) 기반 메타학습이 부상하고 있다. 이 접근법에서는 외부 루프에서 메타파라미터를 학습하고, 내부 루프에서는 현재 작업에서 제공되는 소량의 데이터만을 사용해 작업 특화 모델을 학습한다. 이러한 접근법을 확장시키는 데 있어 핵심적인 과제는 내부 루프 학습 과정을 미분할 필요가 있다는 점이며, 이는 상당한 계산 및 메모리 부담을 초래할 수 있다. 본 연구에서는 은유적 미분(implicit differentiation) 기법을 활용하여, 내부 최적화 문제의 해 자체에만 의존하고 내부 루프 최적화 과정의 경로에는 의존하지 않는 '은유적 MAML(implicit MAML)' 알고리즘을 개발하였다. 이는 메타기울기 계산을 내부 루프 최적화 방법의 선택과 완전히 분리한다. 결과적으로, 본 방법은 내부 루프 최적화 방법의 선택에 무관하며, 기울기 소실(gradient vanishing)이나 메모리 제약 없이 다수의 기울기 단계를 안정적으로 처리할 수 있다. 이론적으로, 은유적 MAML이 단일 내부 루프 기울기를 계산하는 데 필요한 메모리 용량보다 작거나 같은 상수 배수 이내로 메모리 사용량을 유지하면서 정확한 메타기울기를 계산할 수 있음을 증명하였다. 또한 전체 계산 비용은 증가하지 않는다. 실험적으로, 이러한 이점이 적은 샘플 이미지 인식 벤치마크에서 실질적인 성능 향상으로 이어짐을 확인하였다.

임플리시트 기울기를 이용한 메타학습 | 최신 연구 논문 | HyperAI초신경