8일 전
경우의 수 인식 기반 노이즈 저항성 학습을 통한 조직병리학 이미지 분류
Chuang Zhu, Wenkai Chen, Ting Peng, Ying Wang, Mulan Jin

초록
딥러닝 기반의 조직병리학 이미지 분류는 암 진단의 정확성과 신속성을 향상시키는 데 도움이 되는 핵심 기술이다. 그러나 복잡한 수동 레이블링 과정에서 노이즈가 포함된 레이블이 자주 발생하며, 이는 분류 모델의 학습을 오도할 수 있다. 본 연구에서는 조직병리학 이미지 분류를 위한 새로운 하드 샘플 인식형 노이즈 저항 학습 방법을 제안한다. 유의미한 하드 샘플과 해로운 노이즈 샘플을 구분하기 위해, 샘플의 학습 이력 정보를 활용하여 쉽게/어렵게/노이즈 있는(Easy/Hard/Noisy, EHN) 탐지 모델을 구축한다. 이후 이 EHN 모델을 자기 학습 아키텍처에 통합하여 점진적인 레이블 보정을 통해 노이즈 비율을 감소시킨다. 이를 통해 얻어진 거의 깨끗한 데이터셋을 기반으로, 노이즈 억제 및 하드 샘플 강화(Noise Suppressing and Hard Enhancing, NSHE) 전략을 제안하여 노이즈에 강건한 모델을 학습한다. 기존의 방법들과 비교하여 본 방법은 더 많은 깨끗한 샘플을 보존할 수 있으며, 청정 서브셋을 사용하지 않고도 실제 노이즈가 포함된 데이터셋에 직접 적용 가능하다. 실험 결과, 합성 및 실제 세계의 노이즈 데이터셋 모두에서 기존 최고 성능의 방법들을 능가함을 입증하였다. 소스 코드와 데이터는 https://github.com/bupt-ai-cz/HSA-NRL/ 에 공개되어 있다.