18일 전

SnapMix: 세밀한 데이터 증강을 위한 의미론적 비례 혼합

Shaoli Huang, Xinchao Wang, Dacheng Tao
SnapMix: 세밀한 데이터 증강을 위한 의미론적 비례 혼합
초록

데이터 믹싱 증강 기법은 딥 모델 훈련에 효과적임이 입증되었다. 최근의 방법들은 주로 이미지 픽셀의 혼합 비율에 기반하여 레이블을 혼합한다. 그러나 세분화된 이미지의 주요 구분 정보는 일반적으로 미세한 영역에 집중되어 있으므로, 이러한 방식은 세분화된 인식 과정에서 심각한 레이블 노이즈를 유발하기 쉬운 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위해, 클래스 활성화 맵(Class Activation Map, CAM)을 활용하여 증강 과정에서의 레이블 노이즈를 감소시키는 새로운 기법인 의미론적 비율 혼합(Semantically Proportional Mixing, SnapMix)을 제안한다. SnapMix는 혼합된 이미지의 내재적 의미 구성 요소를 추정함으로써 타겟 레이블을 생성하며, 비대칭적인 혼합 연산을 허용하고 합성 이미지와 타겟 레이블 간의 의미적 대응 관계를 보장한다. 실험 결과, 다양한 데이터셋과 서로 다른 네트워크 깊이에서 기존의 혼합 기반 접근법보다 일관되게 우수한 성능을 보였다. 또한 중간 수준의 특징을 통합함으로써 최상의 성능을 달성하였으며, 이는 세분화된 인식 작업에 있어 견고한 기준 모델로 활용될 잠재력을 보여준다. 본 연구의 코드는 https://github.com/Shaoli-Huang/SnapMix.git 에 공개되어 있다.