회귀를 위한 에너지 기반 모델 훈련 방법

최근 몇 년 동안 에너지 기반 모델(EBMs)은 컴퓨터 비전 분야에서 점점 더 인기를 끌고 있다. 이러한 모델은 일반적으로 생성적 이미지 모델링에 활용되지만, 최근 연구에서는 회귀 과제에도 EBMs를 적용하여 객체 탐지 및 시각적 추적에서 최첨단 성능을 달성한 바 있다. 그러나 EBMs의 학습은 여전히 도전적인 과제로 알려져 있다. 생성 모델링을 위한 다양한 기법들이 탐색되었음에도 불구하고, EBMs를 회귀 과제에 적용하는 것은 여전히 잘 연구되지 않은 문제이다. 따라서 EBMs를 최적의 회귀 성능을 위해 어떻게 학습해야 할지에 대한 명확한 지침은 현재까지 존재하지 않는다. 이에 따라 본 연구는 이 문제에 대한 첫 번째 체계적인 연구를 수행한다. 이를 위해 우리는 노이즈 대조 추정(Noise Contrastive Estimation, NCE)의 단순하면서도 매우 효과적인 확장 방안을 제안하며, 1차원 회귀 및 객체 탐지 과제에서 문헌상에서 널리 사용되는 여섯 가지 주요 방법과 철저히 비교한다. 비교 결과에 따르면, 제안한 학습 방법이 가장 우선적으로 고려되어야 할 접근법임이 나타났다. 또한 본 방법을 시각적 추적 과제에 적용하여 다섯 개의 데이터셋에서 최첨단 성능을 달성하였다. 특히, LaSOT에서 63.7%의 AUC, TrackingNet에서 78.7%의 성공률(Success)을 기록하며 뛰어난 성능을 보였다. 코드는 다음 링크에서 제공된다: https://github.com/fregu856/ebms_regression.