
실세계 데이터는 종종 긴 꼬리 분포를 따르며, 이 경우 몇 개의 주요 클래스가 대부분의 데이터를 차지하고 많은 수의 꼬리 클래스는 매우 제한적인 샘플만을 포함합니다. 실제로, 깊은 모델들은 불균형한 분포로 인해 꼬리 클래스에서 빈약한 일반화 성능을 보이는 경우가 많습니다. 이를 해결하기 위해, 데이터 증강이 새로운 샘플을 생성하여 꼬리 클래스에 대한 성능을 향상시키는 효과적인 방법으로 활용되고 있습니다. 그 중 하나로 CutMix가 인기를 얻고 있는데, 이 방법은 두 이미지에서 자른 영역 비율에 따라 라벨을 구성하면서 꼬리 클래스와 다른 클래스의 이미지를 명시적으로 혼합합니다. 그러나 면적 기반 라벨링은 증강된 샘플들의 고유한 의미 정보를 완전히 무시하므로 종종 잘못된 학습 신호를 초래합니다. 이러한 문제를 해결하기 위해, 우리는 의미적으로 일관된 라벨을 가진 증강 샘플을 구축하여 긴 꼬리 인식의 성능을 향상시키는 대조적 CutMix(ConCutMix)를 제안합니다. 구체적으로, 대조적 학습으로 학습된 의미 공간에서 샘플 간 유사성을 계산하고 이를 이용하여 면적 기반 라벨링을 수정합니다. 실험 결과, 우리의 ConCutMix는 꼬리 클래스의 정확도뿐만 아니라 전체 성능에서도 크게 향상되는 것으로 나타났습니다. 예를 들어, ResNeXt-50 기반으로 ImageNet-LT에서 전체 정확도를 3.0% 향상시켰으며, 이는 꼬리 클래스에서 3.3%의 상당한 향상 덕분입니다. 또한 우리는 이러한 향상이 다른 벤치마크와 모델에도 잘 일반화됨을 강조합니다. 우리의 코드와 사전 학습된 모델은 https://github.com/PanHaulin/ConCutMix 에서 확인할 수 있습니다.