2달 전
생성된 호흡음 사용을 통한 적대적 미세조정: 클래스 불균형 문제 해결
Kim, June-Woo ; Yoon, Chihyeon ; Toikkanen, Miika ; Bae, Sangmin ; Jung, Ho-Young

초록
깊은 생성 모델은 의료 이미지 분야에서 데이터 부족 문제를 해결하기 위한 유망한 접근 방식으로 등장했습니다. 그러나 호흡음과 같은 순차적 데이터에 대한 이들의 활용은 덜 연구되어 왔습니다. 본 연구에서는 오디오 확산 모델을 조건부 신경 음성 합성기로 사용하여 불균형한 호흡음 데이터를 증강하는 간단한 방법을 제안합니다. 또한, 합성된 호흡음 샘플과 실제 호흡음 샘플 간의 특성을 일치시키기 위해 단순하면서도 효과적인 적대적 미세 조정 방법을 시연합니다. 이를 통해 호흡음 분류 성능을 향상시킬 수 있습니다. ICBHI 데이터셋에 대한 실험 결과는 제안된 적대적 미세 조정이 효과적이며, 기존의 증강 방법만 사용할 경우 성능 저하가 발생함을 보여줍니다. 더욱이, 우리의 방법은 ICBHI 점수에서 기준 모델보다 2.24% 우수하며, 소수 클래스의 정확도를 최대 26.58%까지 개선합니다. 보충 자료로는 코드를 https://github.com/kaen2891/adversarial_fine-tuning_using_generated_respiratory_sound 에 제공합니다.