HyperAI초신경
3일 전

약한 감독 하에 비행 이미지용 차량 탐지기의 비지도 영역으로의 적응

Xiao Fang; Minhyek Jeon; Zheyang Qin; Stanislav Panev; Celso de Melo; Shuowen Hu; Shayok Chakraborty; Fernando De la Torre
약한 감독 하에 비행 이미지용 차량 탐지기의 비지도 영역으로의 적응
초록

공중 영상에서 차량을 탐지하는 것은 교통 모니터링, 도시 계획 및 국방 정찰 등 다양한 분야에 응용되는 핵심 과제이다. 딥러닝 기법은 이 분야에서 최첨단(SOTA) 성능을 달성하고 있다. 그러나 한 지역의 데이터로 학습된 모델이 다른 지역으로 확장될 때 효과적으로 일반화되지 못하는 문제가 발생한다. 환경 조건, 도시 구조, 도로망, 차량 유형, 영상 촬영 파라미터(해상도, 조명, 촬영 각도 등)의 다양성은 분포 차이(Domain Shift)를 유발하여 모델 성능 저하를 초래한다. 본 논문에서는 생성형 AI를 활용해 고품질의 공중 영상과 레이블을 합성함으로써 데이터 증강을 통해 탐지기 학습을 개선하는 새로운 방법을 제안한다. 본 연구의 주요 기여는, 소스 환경과 타겟 환경 간 분포 간격을 완화하기 위해 미세조정된 잠재 확산 모델(Latent Diffusion Models, LDMs)을 활용한 다단계·다모달 지식 전이 프레임워크를 개발한 것이다. 다양한 공중 영상 도메인에서 수행된 광범위한 실험 결과, 지도 학습(소스 도메인 데이터 기반), 약한 지도 학습 적응 방법, 비지도 도메인 적응 방법, 오픈셋 객체 탐지기 대비 AP50에서 각각 4–23%, 6–10%, 7–40%, 50% 이상의 일관된 성능 향상을 확인하였다. 또한, 본 분야의 추가 연구를 지원하기 위해 뉴질랜드와 유타주에서 새로 수집·라벨링한 두 개의 공중 영상 데이터셋을 제시한다. 프로젝트 페이지는 다음과 같다: https://humansensinglab.github.io/AGenDA