DED: 얼굴 이미지에서 여드름 중증도 평가를 위한 진단 증거 정제
여드름은 사람들의 일상생활에 심각한 영향을 미친다. 여드름의 중증도 등급 분류는 치료에 결정적인 역할을 한다. 그러나 의료 분야에서 여드름 기준은 아직 통일되어 있지 않다. 현재 대부분의 연구는 고급 시각 모델을 여드름 중증도 평가에 적용하는 데 초점을 맞추고 있으나, 여드름 진단의 특성에 대한 적응이 부족하다. 한편 일부 연구는 특정 여드름 기준에 맞게 특화된 방법을 제안하기는 하나, 다른 여드름 기준에는 적용할 수 없는 한계가 있다. 본 연구에서는 여드름 진단의 특성을 적절히 반영할 수 있으며, 다양한 여드름 기준 하에서도 활용 가능한 여드름 진단 방법인 '진단 증거 증류(Diagnostic Evidence Distillation, DED)'를 제안한다. 먼저, 다양한 여드름 기준의 공통점을 철저히 조사·분석하여, 얼굴 전체에 분포한 미세한 병변의 유형과 수를 기반으로 한 진단 증거를 중심으로 여드름 진단을 비정형적인 이미지 분류 문제로 재정의한다. 다음으로, 여드름 진단의 특성을 적합하게 반영하는 DED 프레임워크를 제안한다. 이 프레임워크는 지식 증류 기법의 테이처-스터디 구조를 활용하여, 새로운 환자에게는 제공되지 않지만 학습 데이터에만 존재하는 진단 증거를 진단 모델에 통합한다. 다양한 기준 간의 제약을 극복하기 위해, 피부과 의사의 전반적 평가를 모방할 수 있도록 컨볼루션 신경망(CNN)을 백본으로 사용한다. 또한, 테이처 네트워크의 지도력을 강화하기 위해 하위 과제 공동 학습(subtask joint learning) 기법을 도입한다. DED는 주요 여드름 기준에 기반하여 ACNE04 및 PLSBRACNE01 두 개의 데이터셋에서 여드름 진단에 적용되었다. 실험 결과, 두 데이터셋 모두에서 DED가 진단 성능을 효과적으로 향상시키며, 최신 기술을 능가하고 피부과 전문의 수준의 진단 능력을 달성함을 입증하였다. ACNE04 데이터셋에서는 정밀도(precision) 85.31%, 민감도(sensitivity) 84.83%, 특이도(specificity) 94.66%, 유던 지수(Youden Index) 79.48%, 정확도(accuracy) 86.06%를 기록하였으며, PLSBRACNE01 데이터셋에서는 각각 69.16%, 65.62%, 88.93%, 54.54%, 67.56%의 성능을 달성하였다.