17일 전

노이즈 있는 레이블로부터 학습을 위한 레이블 검색 증강 확산 모델

Jian Chen, Ruiyi Zhang, Tong Yu, Rohan Sharma, Zhiqiang Xu, Tong Sun, Changyou Chen
노이즈 있는 레이블로부터 학습을 위한 레이블 검색 증강 확산 모델
초록

노이즈 있는 레이블로부터 학습하는 것은 실제 응용에서 중요한 오랜 과제이다. 주요 연구 방향 중 하나는 잠재적인 노이즈 있는 레이블을 정제하기 위해 레이블 보정기(라벨 커리렉터)를 학습하는 것이다. 그러나 이러한 방법들은 일반적으로 엄격한 가정에 의존하며, 특정 유형의 레이블 노이즈에 한정되어 있다. 본 논문에서는 생성 모델의 관점에서 레이블 노이즈 문제를 재정의한다. 즉, 레이블은 초기 무작위 추측을 점진적으로 개선함으로써 생성된다고 본다. 이러한 새로운 시각은 기존의 강력한 확산 모델( diffusion models)이 확률적 생성 과정을 원활하게 학습할 수 있도록 한다. 생성 불확실성을 모델링한 후에는 레이블의 최대우도 추정을 통해 분류 추론을 수행할 수 있다. 노이즈 있는 레이블의 영향을 완화하기 위해, 이웃 일관성(neighbor consistency)을 활용하여 확산 학습을 위한 가상의 정제된 레이블을 효과적으로 구성하는 Label-Retrieval-Augmented (LRA) 확산 모델을 제안한다. 제안한 모델은 유연하고 일반적인 특성을 지니며, 사전 훈련된 모델과 같은 다양한 조건 정보를 쉽게 통합할 수 있어 모델 성능을 더욱 향상시킬 수 있다. 폭넓은 실험을 통해 평가를 수행한 결과, 제안 모델은 모든 표준 실세계 벤치마크 데이터셋에서 새로운 최고 성능(SOTA)을 달성하였다. 특히 강력한 CLIP 모델의 조건 정보를 통합함으로써, 많은 경우에서 기존 SOTA 정확도를 10~20%p 이상 높일 수 있었다.

노이즈 있는 레이블로부터 학습을 위한 레이블 검색 증강 확산 모델 | 최신 연구 논문 | HyperAI초신경