4달 전

실세계 혼잡한 상황에서의 인간 포즈 추정

Thomas Golda; Tobias Kalb; Arne Schumann; Jürgen Beyerer
실세계 혼잡한 상황에서의 인간 포즈 추정
초록

최근 딥 컨볼루션 신경망의 도입으로 인간 자세 추정 분야에서 상당한 진전이 이루어졌습니다. 이 기술의 다양한 응용 분야는 최근 몇 년 동안 큰 관심을 받았습니다. 그러나 많은 실제 응용 프로그램은 여전히 다수의 인원이 모인 상황에서의 자세 추정을 요구하며, 이는 아직 충분히 해결되지 않은 문제입니다. 본 연구에서는 이러한 문제를 해결하기 위해 다수의 인원이 모인 상황에서의 자세 추정 방법을 최적화하는 데 중점을 두고 있습니다. 특히, 밀집된 군중 환경에서 발생하는 가림 현상, 서로 가까운 거리에 있는 사람들, 그리고 사람들의 부분적인 가시성 등의 과제에 주목하고 있습니다.이러한 과제를 해결하기 위해 우리는 자세 감지 접근 방식의 세 가지 측면을 평가합니다: i) 가림 현상에 대한 강건성을 향상시키기 위한 데이터 증강 방법, ii) 가려진 신체 부위의 명시적 감지, iii) 합성 생성 데이터셋의 활용. 먼저, COCO (Common Objects in Context) 객체 인식 데이터셋에서 사람과 객체의 클립아웃을 사용하여 훈련 시 가림 현상을 생성함으로써 군중 환경에서의 정확도를 개선하는 방법을 제안합니다. 또한, 실제 군중 응용 프로그램에 사용하기 위해 JTA (Joint Track Auto) 합성 생성 데이터셋을 평가하였습니다.JTA가 저자세 다양성과 덜 밀집된 군중으로 인해 발생하는 전송 간극(transfer gap)을 극복하기 위해 확장 데이터셋이 생성되었습니다. 이를 통해 실제 응용 프로그램에 더 쉽게 적용할 수 있도록 하였습니다. 또한 JTA와 함께 제공되는 가림 플래그(occlusion flags)를 활용하여, 가려진 신체 부위와 보이는 신체 부위를 두 개의 별도 지점에서 명시적으로 구분하도록 하는 모델을 훈련하였습니다. 제안된 기본 방법에 대한 추가 요소들의 조합은 전체 정확도를 4.7% AP(Average Precision) 향상시키며, 이로써 해당 데이터셋에서 현재 최신 접근 방식들과 유사한 결과를 제공합니다.