16일 전

분포 인지형 좌표 표현을 통한 인간 자세 추정

Feng Zhang, Xiatian Zhu, Hanbin Dai, Mao Ye, Ce Zhu
분포 인지형 좌표 표현을 통한 인간 자세 추정
초록

인간 자세 추정 분야에서 히트맵은 사실상의 표준 좌표 표현 방식이지만, 저희가 알고 있는 바에 따르면 기존 문헌에서는 이에 대해 체계적인 연구가 이루어지지 않았다. 본 연구는 이러한 공백을 메우기 위해 히트맵에 특별한 초점을 맞춰 좌표 표현 방식을 체계적으로 탐구한다. 흥미롭게도, 예측된 히트맵을 원본 이미지 공간의 최종 관절 좌표로 복원하는 디코딩 과정이 인간 자세 추정 성능에 놀라울 정도로 중요한 영향을 미친다는 것을 발견하였다. 그러나 이는 이전까지 인식되지 않았던 사실이다. 이러한 발견을 바탕으로, 기존 방법들이 널리 사용하는 표준 좌표 디코딩 방식의 설계적 한계를 심층적으로 분석하고, 보다 체계적이고 분포 인식형의 새로운 디코딩 방법을 제안한다. 동시에, 모델 훈련의 편향을 방지하기 위해 정확한 히트맵 분포를 생성함으로써 표준 좌표 인코딩 과정(즉, 정답 좌표를 히트맵으로 변환하는 과정)을 개선한다. 두 가지 요소를 통합하여, 키포인트에 대한 분포 인식형 좌표 표현(Distribution-Aware coordinate Representation of Keypoint, DARK)이라는 새로운 방법을 제안한다. 이는 모델에 관계없이 적용 가능한 플러그인 형태로 설계되어, 다양한 최첨단 인간 자세 추정 모델의 성능을 크게 향상시킨다. 광범위한 실험을 통해 DARK가 MPII와 COCO라는 두 가지 대표적인 벤치마크에서 일관되게 최고의 성능을 기록함으로써, 본 연구에서 제안한 새로운 좌표 표현 방식의 유용성과 효과성을 확실히 입증하였다.

분포 인지형 좌표 표현을 통한 인간 자세 추정 | 최신 연구 논문 | HyperAI초신경