
초록
이 논문은 인간 분할(human parsing)과 자세 추정(pose estimation)을 동시에 수행하기 위한 새로운 상호 학습 적응 모델(MuLA: Mutual Learning to Adapt)을 제안한다. MuLA는 두 작업 간의 상호 이점을 효과적으로 활용하여, 동시에 두 작업의 성능을 향상시킨다. 기존의 후처리 기반 또는 다중 작업 학습 기반의 방법들과 달리, MuLA는 병렬적으로 수행되는 태스크들로부터 얻은 안내 정보를 반복적으로 활용하여 동적이고 작업에 특화된 모델 파라미터를 예측한다. 이를 통해 MuLA는 상호작용을 통해 상대 태스크의 정보를 통합함으로써 분할 및 자세 추정 모델을 빠르게 적응시켜, 더 강력한 표현 능력을 제공하며, 보다 강건하고 정확한 결과를 도출할 수 있다. MuLA는 합성곱 신경망(convolutional neural networks) 기반으로 구현되었으며, 엔드투엔드(end-to-end) 학습이 가능하다. LIP 및 확장된 PASCAL-Person-Part과 같은 벤치마크에서 실시한 포괄적인 실험을 통해 제안된 MuLA 모델의 효과성과 기존 잘 정립된 기준 모델들에 비해 뛰어난 성능을 입증하였다.