잔차 로그우도 추정을 통한 인간 자세 회귀

히트맵 기반 방법은 가능도 히트맵을 통해 출력 분포를 모델링함으로써 인간 자세 추정 분야에서 주도적인 위치를 차지하고 있다. 반면, 회귀 기반 방법은 더 효율적이지만 성능 측면에서 열등하다는 단점이 있다. 본 연구에서는 최대가능도추정(MLE, Maximum Likelihood Estimation)을 활용하여 효율적이고 효과적인 회귀 기반 방법을 개발한다. MLE 관점에서 볼 때, 다양한 회귀 손실 함수를 채택하는 것은 출력 밀도 함수에 대해 서로 다른 가정을 내포하고 있다. 진정한 분포에 가까운 밀도 함수를 가정할수록 회귀 성능이 향상된다. 이러한 관점에서, 우리는 출력 분포의 본질적 특성을 포착하기 위한 새로운 회귀 프레임워크인 잔차 가능도 추정(Residual Log-likelihood Estimation, RLE)을 제안한다. 구체적으로, RLE는 직접적인 기저 분포를 추정하는 대신 분포의 변화를 학습함으로써 학습 과정을 보다 용이하게 한다. 제안된 재매개변수화 설계 덕분에 본 방법은 기존의 플로우 기반 모델들과 호환 가능하다. 제안된 방법은 효과적이고 효율적이며 유연하다는 점을 입증하였다. 광범위한 실험을 통해 다양한 인간 자세 추정 작업에서의 잠재력을 보여주었다. 기존 회귀 프레임워크와 비교할 때, RLE를 적용한 회귀 방법은 MSCOCO에서 테스트 시 추가 부담 없이 12.4 mAP의 성능 향상을 달성하였다. 더불어, 다인원 자세 추정에서 처음으로 회귀 기반 방법이 히트맵 기반 방법을 능가하는 성과를 보였다. 본 연구의 코드는 https://github.com/Jeff-sjtu/res-loglikelihood-regression 에서 공개되어 있다.