
비지도 도메인 적응(UDA)은 대상 도메인(예: 실제 데이터)에서 추가 주석이 필요하지 않은 상태로 소스 도메인(예: 합성 데이터)에서 훈련된 모델을 대상 도메인에 맞게 조정하는 것을 목표로 합니다. 본 연구는 실제 픽셀 단위 주석이 특히 비싸게 얻어지는 문제를 해결하기 위해 의미 분할을 위한 UDA에 초점을 맞추고 있습니다. 의미 분할을 위한 UDA 방법들은 일반적으로 GPU 메모리 사용량이 많기 때문에, 대부분의 이전 방법들은 축소된 이미지들만을 사용하여 작동하였습니다. 우리는 이러한 설계를 의심합니다. 왜냐하면 저해상도 예측은 종종 세부 정보를 유지하지 못하기 때문입니다. 고해상도 이미지의 임의적인 잘라내기를 사용하여 훈련하는 대안은 이 문제를 완화하지만, 장거리 및 도메인 강인한 문맥 정보를 포착하는 데 부족함이 있습니다. 따라서, 우리는 HRDA라는 다중 해상도 훈련 접근법을 제안합니다. HRDA는 작은 고해상도 잘라내기가 세부 의미 분할 정보를 유지하고 큰 저해상도 잘라내기가 장거리 문맥 의존성을 포착하는 강점을 결합하며, 학습된 스케일 주의력을 통해 관리 가능한 GPU 메모리 용량을 유지합니다. HRDA는 작은 객체들을 적응시키고 세부 의미 분할 정보를 유지하는데 효과적입니다. 이 방법은 GTA-to-Cityscapes에서는 5.5 mIoU, Synthia-to-Cityscapes에서는 4.9 mIoU로 기존 최신 성능을 크게 개선했습니다. 이를 통해 각각 73.8와 65.8 mIoU라는 전례 없는 성능을 달성하였습니다. 해당 구현은 https://github.com/lhoyer/HRDA에서 제공됩니다.