Mahalanobis 거리 기반 다중 시점 최적 운송 방법을 이용한 다중 시점 군중 위치 추정

다중 시점 군중 위치 추정은 장면 내 모든 사람의 지상 위치를 예측합니다. 일반적인 방법들은 보통 먼저 지면 평면에서 군중 밀도 맵을 추정한 후, 군중 위치를 얻습니다. 그러나 기존 방법들의 성능은 혼잡한 지역에서 밀도 맵의 모호성에 의해 제한되며, 이로 인해 국부적 피크들이 부드럽게 사라질 수 있습니다. 밀도 맵 감독의 약점을 완화하기 위해, 단일 이미지 군중 위치 추정 작업에서는 최적 운송 기반 점 감독 방법이 제안되었지만, 아직 다중 시점 군중 위치 추정에는 적용되지 않았습니다. 따라서 본 논문에서는 다중 시점 군중 위치 추정을 위해 특별히 설계된 새로운 마할라노비스 거리 기반 다중 시점 최적 운송 (M-MVOT) 손실 함수를 제안합니다.첫째, 우리는 비용 함수에서 타원형 등고선을 정의하는 마할라노비스 거리를 사용하여 유클리디언 거리 기반 운송 비용을 대체합니다. 여기서 등고선의 긴 축과 짧은 축 방향은 시점 레이 방향에 의해 안내됩니다. 둘째, 각 시점에서 객체-카메라 거리는 카메라로부터 멀리 떨어진 잘못된 예측에 대해 더 큰 벌금을 부과하기 위해 각 위치의 최적 운송 비용을 더욱 조정하는 데 사용됩니다. 마지막으로, 우리는 모델 손실 (M-MVOT)에서 모든 입력 카메라 시점을 고려하는 전략을 제안합니다. 이는 각 지면 진실값 포인트가 가장 가까운 카메라를 기준으로 최적 운송 비용을 계산함으로써 이루어집니다.실험 결과는 제안된 방법이 여러 다중 시점 군중 위치 추정 데이터셋에서 밀도 맵 기반 또는 일반적인 유클리디언 거리 기반 최적 운송 손실보다 우수함을 입증하였습니다.프로젝트 페이지: https://vcc.tech/research/2024/MVOT.