전역 및 국부 혼합 일관성 누적 학습을 통한 장기 시각 인식

본 논문에서는 장미 꼬리 분포(long-tail) 시각 인식을 위한 간단한 학습 패러다임을 설계하는 것이 목표입니다. 이 패러다임은 특성 추출기의鲁棒性를 향상시키는 동시에 분류기의 머리 클래스(head classes) 편향 문제를 완화하고, 학습 기술과 부담을 줄이는 것을 목표로 합니다. 우리는 이를 위해 장미 꼬리 분포 시각 인식에 대한 효율적인 단일 단계 학습 전략인 전역 및 국소 혼합 일관성 누적 학습(GLMC, Global and Local Mixture Consistency cumulative learning)을 제안합니다. 우리의 주요 아이디어는 두 가지입니다: (1) 전역 및 국소 혼합 일관성 손실은 특성 추출기의鲁棒性를 개선합니다. 구체적으로, 동일한 배치 데이터에서 전역 MixUp과 국소 CutMix를 각각 사용하여 두 개의 증강된 배치를 생성하고, 그 다음 코사인 유사도를 사용하여 차이를 최소화합니다. (2) 누적 머리-꼬리 소프트 라벨 재가중 손실은 머리 클래스 편향 문제를 완화합니다. 우리는 경험적 클래스 빈도를 사용하여 장미 꼬리 분포 데이터의 머리-꼬리 클래스 혼합 라벨을 재가중하고, 그 후 에폭(epoch)별로 누적된 계수로 일반적인 손실과 재가중된 손실 사이의 균형을 맞춥니다. 본 접근 방식은 CIFAR10-LT, CIFAR100-LT, 그리고 ImageNet-LT 데이터셋에서 최고 수준의 정확도를 달성하였습니다. 또한 균형 잡힌 ImageNet과 CIFAR에서 추가 실험을 수행한 결과, GLMC가 백본(backbones)의 일반화 성능을 크게 향상시킬 수 있음을 확인하였습니다. 코드는 https://github.com/ynu-yangpeng/GLMC에서 공개적으로 제공됩니다.注:在翻译中,“鲁棒性”(robustness)是一个中文术语,正确的韩文翻译应为“내성”或“강건성”。以下是修正后的版本:본 논문에서는 장미 꼬리 분포(long-tail) 시각 인식을 위한 간단한 학습 패러다임을 설계하는 것이 목표입니다. 이 패러다임은 특성 추출기의 강건성을 향상시키는 동시에 분류기의 머리 클래스(head classes) 편향 문제를 완화하고, 학습 기술과 부담을 줄이는 것을 목표로 합니다. 우리는 이를 위해 장미 꼬리 분포 시각 인식에 대한 효율적인 단일 단계 학습 전략인 전역 및 국소 혼합 일관성 누적 학습(GLMC, Global and Local Mixture Consistency cumulative learning)을 제안합니다. 우리의 주요 아이디어는 두 가지입니다: (1) 전역 및 국소 혼합 일관성 손실은 특성 추출기의 강건성을 개선합니다. 구체적으로, 동일한 배치 데이터에서 전역 MixUp과 국소 CutMix를 각각 사용하여 두 개의 증강된 배치를 생성하고, 그 다음 코사인 유사도를 사용하여 차이를 최소화합니다. (2) 누적 머리-꼬리 소프트 라벨 재가중 손실은 머리 클래스 편향 문제를 완화합니다. 우리는 경험적 클래스 빈도를 사용하여 장미 꼬리 분포 데이터의 머리-꼬리 클래스 혼합 라벨을 재가중하고, 그 후 에폭(epoch)별로 누적된 계수로 일반적인 손실과 재가중된 손실 사이의 균형을 맞춥니다. 본 접근 방식은 CIFAR10-LT, CIFAR100-LT, 그리고 ImageNet-LT 데이터셋에서 최고 수준의 정확도를 달성하였습니다. 또한 균형 잡힌 ImageNet과 CIFAR에서 추가 실험을 수행한 결과, GLMC가 백본(backbones)의 일반화 성능을 크게 향상시킬 수 있음을 확인하였습니다. 코드는 https://github.com/ynu-yangpeng/GLMC에서 공개적으로 제공됩니다.