한 달 전

다중 시각 영역을 위한 잔차 어댑터 학습

Sylvestre-Alvise Rebuffi; Hakan Bilen; Andrea Vedaldi
다중 시각 영역을 위한 잔차 어댑터 학습
초록

다양한 유형의 문제와 데이터에 대해 잘 작동하는 데이터 표현을 학습하는 데 대한 관심이 점점 커지고 있습니다. 본 논문에서는 특히 다양한 유형의 이미지, 예를 들어 개 종류에서부터 정지 표지판과 숫자까지 성공적으로 활용할 수 있는 단일 시각적 표현을 학습하는 작업에 초점을 맞추고 있습니다. 최근 다른 네트워크의 매개변수를 예측하는 네트워크 학습 연구에서 영감을 받아, 어댑터 잔여 모듈을 통해 실시간으로 다양한 시각적 도메인으로 조정할 수 있는 조절 가능한 딥 네트워크 아키텍처를 개발하였습니다. 본 방법은 도메인 특화 표현의 정확성을 유지하거나 심지어 향상시키면서도 높은 수준의 매개변수 공유를 달성합니다. 또한, 10개의 매우 다른 시각적 도메인을 동시에 포착하고 균일하게 인식할 수 있는 표현의 능력을 평가하는 벤치마크인 Visual Decathlon Challenge(비주얼 디카톤 챌린지)를 소개합니다. 이 벤치마크는 표현이 모든 도메인에서 일관되게 우수한 인식 능력을 보이는지를 측정합니다.

다중 시각 영역을 위한 잔차 어댑터 학습 | 최신 연구 논문 | HyperAI초신경