17일 전

Dite-HRNet: 인간 자세 추정을 위한 동적 경량 고해상도 네트워크

Qun Li, Ziyi Zhang, Fu Xiao, Feng Zhang, Bir Bhanu
Dite-HRNet: 인간 자세 추정을 위한 동적 경량 고해상도 네트워크
초록

고해상도 네트워크는 인간 자세 추정을 위한 다중 스케일 특징을 추출하는 데 뛰어난 능력을 보이지만, 관절 간의 장거리 상호작용을 포착하지 못하고 계산 복잡도가 높다는 한계가 있다. 이러한 문제를 해결하기 위해, 다중 스케일의 맥락 정보를 효율적으로 추출하고 인간 자세 추정을 위한 장거리 공간적 종속성을 모델링할 수 있는 동적 경량 고해상도 네트워크(Dite-HRNet)를 제안한다. 구체적으로, 동적 스플릿 컨볼루션(dynamic split convolution)과 적응형 맥락 모델링(adaptive context modeling)이라는 두 가지 방법을 제안하고, 이를 기반으로 새로운 경량 블록 두 종류—동적 다중 스케일 맥락 블록(dynamic multi-scale context block)과 동적 전역 맥락 블록(dynamic global context block)—에 통합하였다. 이 두 블록은 Dite-HRNet의 기본 구성 요소로서, 고해상도 네트워크의 병렬 다중 해상도 아키텍처를 최대한 활용하도록 특별히 설계되었다. 실험 결과, 제안된 네트워크는 COCO 및 MPII 인간 자세 추정 데이터셋에서 기존 최고 성능을 기록한 경량 네트워크를 초월하는 뛰어난 성능을 달성하였다. 코드는 다음과 같은 주소에서 공개되어 있다: https://github.com/ZiyiZhang27/Dite-HRNet.

Dite-HRNet: 인간 자세 추정을 위한 동적 경량 고해상도 네트워크 | 최신 연구 논문 | HyperAI초신경