CycleGuardian: 개선된 딥 클러스터링과 대조 학습을 기반으로 한 자동 호흡음 분류 프레임워크

호흡기 소리 청진은 초기 호흡기 및 폐 질환 진단에서 핵심적인 역할을 한다. 코로나19 이후 딥러닝 기반의 자동 호흡기 소리 분류 기법이 등장했음에도 불구하고, 제한된 데이터셋으로 인해 성능 향상이 어려운 실정이다. 정상 및 비정상 호흡기 소리 모두에서 정상적인 호흡 성분과 노이즈 성분이 동시에 존재하기 때문에, 두 유형을 구분하는 데 어려움이 있다. 또한 다양한 비정상 호흡기 소리는 유사한 이상 특징을 보이므로, 이들 간의 구분이 어렵다. 더불어 기존 최첨단 모델들은 파라미터 수가 과도하게 많아 자원 제약이 심한 모바일 플랫폼에의 배포를 어렵게 한다. 이러한 문제를 해결하기 위해 우리는 경량화된 네트워크인 CycleGuardian을 설계하고, 개선된 딥 클러스터링과 대조 학습(contrastive learning)을 기반으로 한 프레임워크를 제안한다. 먼저, 특징의 다양성을 확보하기 위해 하이브리드 스펙트로그램을 생성하고, 간헐적인 비정상 소리 탐지를 용이하게 하기 위해 스펙트로그램을 그룹화한다. 이후 CycleGuardian은 깊은 클러스터링 모듈과 유사도 제약 클러스터링 구성 요소를 통합하여 비정상 특징을 보다 효과적으로 포착할 수 있도록 하며, 그룹 믹싱(group mixing) 기능을 갖춘 대조 학습 모듈을 통해 비정상 특징의 구분 능력을 향상시킨다. 다목적 최적화는 학습 과정에서 전체 성능을 강화한다. 실험에서는 ICBHI2017 데이터셋을 공식적인 분할 방식에 따라 사용하였으며, 사전 학습된 가중치 없이 진행한 결과, 본 방법은 정밀도(Sp): 82.06%, 민감도(Se): 44.47%, 스코어(Score): 63.26%를 달성하였으며, 모델 크기는 38M으로, 기존 최고 성능 모델 대비 약 7%의 성능 향상을 기록하여 현재까지 가장 우수한 성능을 달성하였다. 또한 본 네트워크를 안드로이드 기기 상에 배포하여 종합적인 지능형 호흡기 소리 청진 시스템을 구현함으로써, 실용성과 적용 가능성을 입증하였다.