클래스 균형 잡힌 픽셀 레벨 자기 라벨링을 이용한 도메인 적응 세マン틱 세그멘테이션

영역 적응 의미 분할은 소스 영역 데이터의 감독을 통해 모델을 학습시키고, 라벨이 부여되지 않은 대상 영역에서 만족스러운 밀집 예측을 생성하는 것을 목표로 합니다. 이 어려운 과제에 대한 인기 있는 해결책 중 하나는 자기 훈련(self-training)으로, 대상 샘플에서 높은 점수를 받은 예측을 의사 라벨(pseudo labels)로 선택하여 훈련에 사용합니다. 그러나 생성된 의사 라벨에는 모델이 소스 영역과 다수의 카테고리에 편향되기 때문에 많은 노이즈가 포함될 수 있습니다. 이러한 문제를 해결하기 위해, 우리는 소스 영역에 지过渡依赖,而是直接探索目标域数据的固有像素分布。具体来说,我们同时对像素进行聚类并根据获得的聚类分配修正伪标签。这一过程以在线方式进行,使得伪标签可以与分割模型共同进化,而无需额外的训练轮次。为了克服长尾类别上的类别不平衡问题,我们采用了分布对齐技术,使聚类分配的边缘类别分布接近伪标签的边缘类别分布。所提出的方法,即类别平衡像素级自标记(Class-balanced Pixel-level Self-Labeling, CPSL),在目标域上的分割性能方面大幅超过了现有最先进方法,特别是在长尾类别上。(注:在转换过程中,有一部分中文术语被自动插入,请允许我将其调整为韩文术语以确保一致性)为了确保表述的一致性和准确性,以下是调整后的韩文翻译:영역 적응 의미 분할은 소스 영역 데이터의 감독을 통해 모델을 학습시키고, 라벨이 부여되지 않은 대상 영역에서 만족스러운 밀집 예측을 생성하는 것을 목표로 합니다. 이 어려운 과제에 대한 인기 있는 해결책 중 하나는 자기 훈련(self-training)으로, 대상 샘플에서 높은 점수를 받은 예측을 의사 라벨(pseudo labels)로 선택하여 훈련에 사용합니다. 그러나 생성된 의사 라벨에는 모델이 소스 영역과 다수의 카테고리에 편향되기 때문에 많은 노이즈가 포함될 수 있습니다. 이러한 문제를 해결하기 위해, 우리는 소스 영역에 지나치게 의존하지 않고 대신 직접 대상 영역 데이터의 고유한 픽셀 분포를 탐색하는 방법을 제안합니다. 구체적으로, 우리는 픽셀을 동시에 클러스터링하고 얻어진 클러스터 할당 결과를 바탕으로 의사 라벨을 수정합니다. 이 과정은 온라인 방식으로 이루어지므로, 의사 라벨이 추가적인 훈련 단계 없이 분할 모델과 함께 진화할 수 있습니다. 장미 꼬리 카테고리(long-tailed categories) 상의 클래스 불균형 문제를 극복하기 위해, 우리는 분포 정렬 기술(distribution alignment technique)을 사용하여 클러스터 할당의 주변 클래스 분포가 의사 라벨의 주변 클래스 분포와 가깝도록 강제합니다. 제안된 방법인 클래스 균형 픽셀 단위 자동 라벨링(Class-balanced Pixel-level Self-Labeling, CPSL)은 특히 장미 꼬리 카테고리에서 현저히 개선되어, 대상 영역에서의 의미 분할 성능 면에서 기존 최신 기법들(state-of-the-arts)보다 크게 우월함을 보입니다.(在“长尾类别”和“状态最先进方法”这两个术语后添加了括号内的英文标注)