AID: 정보 드롭 오프닝 증강을 통한 인간 자세 추정의 성능 한계 극복

자세 추정에서 외형적 단서(appearance cue)와 제약 조건 단서(constraint cue)는 모두 핵심적인 역할을 한다. 그러나 기존 대부분의 연구에서는 외형적 단서에 과도하게 적응하는 경향을 보이며, 제약 조건 단서는 간과하는 경향이 있다. 본 논문에서는 이러한 모순을 검증하고 해결하기 위해 정보 제거 기반 증강(Augmentation by Information Dropping, AID)을 제안한다. AID의 잠재력을 효과적으로 활용하기 위한 전제 조건으로, 정보 공급 관점에서 학습 과정의 손실 및 성능 패턴을 분석하여 맞춤형 학습 스케줄을 제안한다. 실험 결과, AID는 모델에 종속되지 않는 접근 방식으로, 다양한 입력 크기, 아키텍처, 백본, 학습 및 테스트 세트를 사용하는 하향식(top-down) 및 상향식(bottom-up) 패러다임의 최신 기법들에 모두 긍정적인 영향을 미쳤다. 대표적인 COCO 인간 자세 추정 테스트 세트에서, 하향식 패러다임에서는 다양한 구성에 대해 약 0.6 AP의 지속적인 성능 향상을, 상향식 패러다임에서는 최대 1.5 AP의 향상을 기록했다. 더 도전적인 CrowdPose 데이터셋에서는 1.5 AP 이상의 성능 향상이 관측되었다. AID는 인간 자세 추정 문제의 성능 한계를 상당한 폭으로 확장하며 새로운 최고 성능 기록을 세웠다. 따라서 우리는 AID가 인간 자세 추정기 학습 시 일반적인 구성 요소로 자리 잡기를 기대한다. 관련 소스 코드는 향후 연구를 위해 공개될 예정이다.