16일 전

클러스터 수 세기 위한 분포 매칭

Boyu Wang, Huidong Liu, Dimitris Samaras, Minh Hoai
클러스터 수 세기 위한 분포 매칭
초록

집단 인원 수 세기(task)에서 각 학습 이미지에는 여러 명의 사람이 포함되며, 각 사람은 점(dots)으로 레이블링된다. 기존의 집단 인원 수 세기 방법은 각 레이블링된 점에 대해 가우시안(Gaussian)을 적용하여 점을 부드럽게 처리하거나, 주어진 레이블링 점에 기반하여 각 픽셀의 가능성을 추정해야 한다. 본 논문에서는 레이블링에 가우시안을 강제 적용하는 것이 일반화 성능을 저해함을 보여준다. 대신, 집단 인원 수 세기용 분포 매칭(Distribution Matching) 기법을 제안한다. 이 방법을 DM-Count라 명명한다. DM-Count에서는 최적 운반(Optimal Transport, OT)을 활용하여 정규화된 예측 밀도 맵과 정규화된 정답 밀도 맵 사이의 유사도를 측정한다. OT 계산의 안정성을 확보하기 위해 모델에 전역 변동성 손실(Total Variation loss)을 포함한다. 본 연구에서는 DM-Count의 일반화 오차 한계가 가우시안 부드러운 처리 방법보다 더 날카롭다는 것을 입증한다. 평균 절대 오차(Mean Absolute Error) 기준으로, DM-Count는 UCF-QNRF 및 NWPU와 같은 두 개의 대규모 세기 데이터셋에서 기존 최고 성능 방법보다 크게 우수한 성능을 보이며, 상하이기술 대학(ShanghaiTech) 및 UCF-CC50 데이터셋에서도 최신 기준 성능을 달성한다. 특히, 기존 최고 성능 논문 결과 대비 오차를 약 16% 감소시켰다. 코드는 https://github.com/cvlab-stonybrook/DM-Count 에서 공개되어 있다.

클러스터 수 세기 위한 분포 매칭 | 최신 연구 논문 | HyperAI초신경