밀도 있는 군중에서 카운팅, 밀도 맵 추정 및 위치 결정을 위한 구성 손실

매년 수백만 명의 사람들이 순례, 시위, 콘서트, 마라톤, 축제 및 장례식 등 다양한 행사에 모이는 상황에서 시각적 인파 분석은 컴퓨터 비전의 새로운 영역으로 부상하고 있습니다. 특히, 고밀도 인파에서 사람을 세는 것은 인파 안전과 관리뿐만 아니라 시위와 집회的政治重要性评估中的应用范围广泛,是一个具有挑战性的问题。在本文中,我们提出了一种新颖的方法,该方法可以同时解决给定高密度人群图像中的人数统计、密度图估计和定位问题。我们的公式基于一个重要的观察结果,即这三个问题是相互关联的,使得用于优化深度CNN的损失函数可分解。由于定位需要高质量的图像和注释,我们引入了UCF-QNRF 데이터셋, 이는 이전 데이터셋들의 단점을 극복하고 125만 명의 사람이 점 주석으로 수동으로 표시된 것을 포함합니다. 마지막으로, 최근 개발된 군중 카운팅 전용 깊은 CNN 네트워크를 포함하여 평가 지표와 비교 결과를 제시합니다. 우리의 접근 방식은 가장 도전적인 데이터셋인 가장 다양한 장면에서 가장 많은 군중 주석을 가진 새로운 데이터셋에서 현존하는 최고 기술을 크게 능가합니다.注意:在上述翻译中,“政治重要性评估”(gauging political significance)部分被误译为中文。以下是修正后的韩文翻译:특히, 고밀도 인파에서 사람을 세는 것은 인파 안전과 관리뿐만 아니라 시위와 집회의 정치적 중요성을 평가하는 데 있어서 적용 범위가 넓으며, 매우 도전적인 문제입니다. 본 논문에서는 이러한 문제들을 동시에 해결할 수 있는 새로운 접근 방식을 제안합니다. 제안된 방법은 주어진 고밀도 군중 이미지에서 사람의 수를 세고, 밀도 맵을 추정하며, 위치를 결정하는 문제를 동시에 해결합니다. 우리의 공식화는 세 가지 문제가 서로 본질적으로 관련되어 있다는 중요한 관찰 결과에 기반하여 깊은 CNN의 손실 함수를 분해 가능하게 만듭니다. 위치 결정이 고품질 이미지와 주석이 필요하기 때문에, 우리는 이전 데이터셋들의 단점을 극복한 UCF-QNRF 데이터셋을 소개합니다. 이 데이터셋에는 125만 명의 사람이 점 주석으로 수동으로 표시되어 있습니다. 마지막으로, 최근 개발된 군중 카운팅 전용 깊은 CNN 네트워크를 포함하여 평가 지표와 비교 결과를 제시합니다. 우리의 접근 방식은 가장 다양한 장면에서 가장 많은 군중 주석을 가진 가장 도전적인 데이터셋인 새로운 데이터셋에서 현존하는 최고 기술보다 크게 우수한 성능을 보입니다.