15일 전

PhysAug: 단일 도메인 일반화 객체 탐지를 위한 물리적 지도 및 주파수 기반 데이터 증강

Xiaoran Xu, Jiangang Yang, Wenhui Shi, Siyuan Ding, Luqing Luo, Jian Liu
PhysAug: 단일 도메인 일반화 객체 탐지를 위한 물리적 지도 및 주파수 기반 데이터 증강
초록

단일 도메인 일반화 객체 탐지(Single-Domain Generalized Object Detection, S-DGOD)는 객체 탐지기의 장점을 활용하여 단일 소스 도메인에서 학습함으로써 다양한 미지의 타겟 도메인에서도 견고한 성능을 발휘하는 것을 목표로 한다. 기존의 S-DGOD 접근 방식은 주로 시각적 변환의 조합을 포함한 데이터 증강 전략에 의존하여 탐지기의 일반화 능력을 향상시키려 한다. 그러나 현실 세계의 사전 지식이 부재함으로써 데이터 증강이 학습 데이터 분포의 다양성에 기여하는 데 한계가 있다. 이러한 문제를 해결하기 위해, 본 연구는 물리 모델 기반의 비이상적인 촬영 조건을 고려한 새로운 데이터 증강 방법인 PhysAug를 제안한다. 이는 대기 광학의 원리를 기반으로 하며, 보편적인 방해 요소 모델을 개발하여 PhysAug의 기반을 마련한다. 시각적 왜곡은 일반적으로 빛이 대기 중 입자와 상호작용함으로써 발생하므로, 이미지 주파수 스펙트럼을 활용하여 학습 과정에서 현실 세계의 변동을 모사한다. 이러한 접근은 탐지기가 도메인 불변 표현을 학습하도록 유도함으로써 다양한 환경에서의 일반화 능력을 강화한다. 네트워크 아키텍처나 손실 함수를 변경하지 않고도, 본 방법은 다양한 S-DGOD 데이터셋에서 최신 기술을 상회하는 성능을 달성한다. 특히 DWD와 Cityscape-C에서 기준 모델 대비 각각 7.3%, 7.2%의 상당한 성능 향상을 기록하며, 실제 환경에서의 강화된 일반화 능력을 입증한다.

PhysAug: 단일 도메인 일반화 객체 탐지를 위한 물리적 지도 및 주파수 기반 데이터 증강 | 최신 연구 논문 | HyperAI초신경