17일 전

이미지 기반 및 부분 범주형 레이블링 접근법을 통한 보행자 속성 인식

{Ahmad Kalhor, Mehdi Tale Masouleh, Seraj Ghasemi, Shayan Samiee, Farbod Siahkali, Hossein Bodaghi}
초록

텍스트 기반 검색은 보행자 속성 인식(Pedestrian Attribute Recognition, PAR)을 활용하여 사람 재식별(re-Identification, re-ID) 감시 시스템에 통합할 수 있다. 재-ID 모델에 CNN 기반의 PAR 모듈을 추가하는 것은 두 작업 모두에 대해 효율적인 접근이지만, 모델 자체를 개선하는 것보다는 데이터를 수정하는 방향으로 성능을 향상시키는 연구는 여전히 부족하다. 현재 대부분의 다중 작업(multi-task) 방법들은 계산 비용, 배포의 난이도, 일반화 능력 등을 고려하지 않고, 고정된 데이터셋에서 새로운 모델과 아키텍처를 도입하여 기존 방법을 능가하려는 경향이 있다. 본 연구는 PAR 성능에 미치는 데이터의 영향을 분석하기 위해, DukeMTMC-reID 데이터셋의 74개 보행자 속성에 대해 36,411장의 이미지를 포함하는 이미지 기반 부분적 범주형 속성 데이터셋(CA-Duke)을 제안한다. 그러나 현재의 방법들은 추가 모듈을 삽입할 최적의 위치를 결정하기 위한 체계적인 접근법이 부족하며, 보통 실험적 과정을 통해 기준 모델에 새로운 모듈을 배치하여 다중 작업 네트워크를 구축한다. 본 연구는 재-ID 사전 학습된 네트워크에 PAR 모듈을 추가할 최적의 위치를 식별하기 위해, 잠재 공간(latent space) 내 데이터의 분리 가능성을 평가하기 위한 새로운 지표인 분리 지수(Separation Index, SI)를 도입한 이단계 학습 방법을 제안한다. 최종적으로, 속성 인식 및 검색 결과에 대한 광범위한 실험을 통해, 포괄적이고 이미지 기반의 주석(annotation)이 F1 지표 기준으로 네트워크 성능을 3.31% 향상시킬 수 있음을 확인하였다. 또한 SI와 사전 학습된 네트워크를 결합함으로써 PAR에서 최신 기술 수준(SOTA)의 성능을 달성할 수 있음을 입증하였다.

이미지 기반 및 부분 범주형 레이블링 접근법을 통한 보행자 속성 인식 | 최신 연구 논문 | HyperAI초신경