
초록
우리는 BAPose를 제안합니다. 이는 새로운 하향식 접근 방식으로, 다중 인물 자세 추정에서 최고 수준의 결과를 달성합니다. 우리의 엔드투엔드 학습 가능한 프레임워크는 분리된 다중 스케일 폭포 구조와 적응적 컨볼루션을 활용하여 혼잡한 장면에서 가림 현상이 있는 경우 키포인트를 더욱 정확하게 추론할 수 있습니다. BAPose의 분리된 폭포 모듈에서 얻은 다중 스케일 표현은 캐스케이드 구조의 점진적 필터링 효율성을 활용하면서, 공간 피라미드 구성과 유사한 다중 스케일 시야를 유지합니다. COCO와 CrowdPose 데이터셋에서의 우리의 실험 결과는 BAPose가 다중 인물 자세 추정에 있어 효율적이고 강건한 프레임워크이며, 최신 기술 대비 상당한 정확도 향상을 이룩함을 보여줍니다.