17일 전
도메인 일반화된 세분화를 위한 재파라미터화된 비전 트랜스포머(ReVT)
Jan-Aike Termöhlen, Timo Bartels, Tim Fingscheidt

초록
세마틱 세그멘테이션의 과제는 이미지의 각 픽셀에 의미적 레이블을 할당하는 것이다. 그러나 이러한 모델의 성능은 학습 도메인과 다른 데이터 분포를 가진 미지의 도메인에 배포될 때 저하된다. 본 연구에서는 학습 후 여러 모델의 가중 평균을 적용한 재패러미터화된 비전 트랜스포머(ReVT)를 활용하여 도메인 일반화를 위한 새로운 증강 기반 접근법을 제안한다. 제안한 방법은 여러 표준 벤치마크 데이터셋에서 평가되었으며, 소형 모델의 경우 기존 최고 성능(46.3%) 대비 47.3%의 최신 기준 mIoU 성능을 달성하였고, 중형 모델의 경우 50.1%로 기존 최고 성능(47.8%)을 상회하였다. 동시에 본 방법은 더 적은 파라미터 수를 사용하며, 기존 최고 성능보다 더 높은 프레임레이트를 달성한다. 또한 구현이 간편하며, 네트워크 앙상블과 달리 추론 시 추가적인 계산 복잡성을 수반하지 않는다.