17일 전

탐욕적 오프셋 지도 키포인트 그룹화를 통한 인간 자세 추정

Jia Li, Linhua Xiang, Jiwei Chen, Zengfu Wang
탐욕적 오프셋 지도 키포인트 그룹화를 통한 인간 자세 추정
초록

다수의 사람에 대한 자세 추정 문제를 해결하기 위해 정확도와 효율성 사이에 우수한 균형을 갖춘 간단하면서도 신뢰할 수 있는 하향식 접근법을 제안한다. 주어진 이미지에 대해, 우리는 Hourglass 네트워크를 활용하여 서로 다른 사람들의 모든 관건점(keypoints)을 구분 없이 추론하고, 동일한 사람에 속한 인접한 관건점들을 연결하는 지도(offset)를 동시에 예측한다. 이후 예측된 지도 오프셋을 활용하여 후보 관건점을 탐욕적으로 그룹화하여 여러 사람의 자세(해당되는 경우)를 구성한다. 이 과정을 탐욕적 오프셋 유도 관건점 그룹화(Greedy Offset-guided Keypoint Grouping, GOG)라고 부른다. 또한 다수의 사람에 대한 관건점 좌표를 위한 인코딩-디코딩 방식을 재검토하며 정확도에 영향을 주는 몇 가지 중요한 사실을 밝혀낸다. 실험을 통해 도입한 구성 요소들이 뚜렷한 성능 향상을 가져옴을 확인하였다. 제안하는 방법은 공정한 조건 하에서 도전적인 COCO 데이터셋에서 최신 기술과 경쟁 가능한 성능을 보였다. 소스 코드와 사전 학습된 모델은 모두 공개적으로 온라인에서 제공된다.

탐욕적 오프셋 지도 키포인트 그룹화를 통한 인간 자세 추정 | 최신 연구 논문 | HyperAI초신경