
분류 문제에 대해 종단 간(end-to-end) 방식으로 레이블 정보를 활용한 지도 학습 기반 방법은 현재까지 최고의 성능을 기록해 왔다. 그러나 이러한 방법은 특히 데이터가 극히 제한된 상황(저데이터 환경)에서 일반화 능력에 한계를 보일 수 있다. 본 연구에서는 이러한 문제를 해결하기 위해 가용한 메타데이터(metadata)를 활용한 지도 대조 학습(supervised contrastive learning)을 통해 다수의 사전 작업(pretext tasks)을 수행함으로써 데이터의 우수한 표현을 학습하는 방식을 제안한다. 이 방법을 호흡 음성 분류 문제에 적용하였으며, 이는 성별 및 연령과 같은 인구통계학적 정보가 폐 질환의 존재와 관련이 있기 때문에 적합한 설정이다. 이러한 정보를 암묵적으로 인코딩하는 시스템을 학습하면 이상 징후를 더 효과적으로 탐지할 수 있다. 지도 대조 학습은 동일한 클래스 레이블을 가진 샘플들에 대해 유사한 표현을 학습하고, 서로 다른 클래스 레이블을 가진 샘플들에 대해서는 비유사한 표현을 학습하는 학습 프레임워크이다. 이 프레임워크를 통해 학습된 특징 추출기(feature extractor)는 데이터로부터 유용한 특징을 추출할 수 있으며, 두 개의 서로 다른 데이터셋에서 호흡 이상 분류 성능 측면에서 교차 엔트로피(cross-entropy)보다 우수한 성능을 보였다. 또한, 클래스 레이블 없이 메타데이터만을 사용하여 표현을 학습하는 경우에도, 클래스 레이블만을 사용한 교차 엔트로피 학습과 유사한 성능을 달성함을 확인하였다. 더 나아가, 클래스 레이블과 메타데이터를 결합하여 동일한 성별과 연령 그룹 내 환자들을 그룹화하는 추가 작업을 수행하는 다중 지도 대조 학습의 확장 방식을 적용할 경우, 보다 정보가 �-rich한 특징이 학습됨을 확인하였다. 본 연구는 클래스 불균형과 데이터 부족 상황에서 다양한 메타데이터 소스를 지도 대조 학습 설정에 활용할 수 있는 잠재력을 시사한다. 본 연구의 코드는 https://github.com/ilyassmoummad/scl_icbhi2017 에 공개되어 있다.