
초록
본 연구에서는 이미지에서 군중 수를 세는 문제를 다룹니다. 이 문제를 해결하기 위해 합성곱 신경망(Convolutional Neural Network, CNN) 기반의 밀도 추정 접근법을 제시합니다. 한 번에 고해상도 밀도 맵을 예측하는 것은 어려운 작업입니다. 따라서, 저해상도 밀도 맵을 생성한 후 이를 활용하여 고해상도 밀도 맵을 생성하는 두 가지 분기 구조의 CNN 아키텍처를 제안합니다. 첫 번째 분기는 저해상도 밀도 맵을 생성하고, 두 번째 분기는 첫 번째 분기에서 생성된 저해상도 예측값과 특징 맵을 통합하여 고해상도 밀도 맵을 생성합니다. 또한, 파이프라인의 각 단계가 이전 모든 단계의 예측값을 활용하는 다단계 확장 방안을 제안합니다. 기존 최고 성능의 군중 수 세기 방법들과의 경험적 비교 결과, 본 연구의 방법은 Shanghaitech, WorldExpo'10, UCF 데이터셋 등 세 가지 도전적인 군중 수 세기 벤치마크에서 가장 낮은 평균 절대 오차를 달성하였습니다.