이중 베이지안 ResNet: 심장 혈류음 탐지에 대한 딥러닝 접근법

이 연구는 우리 팀 PathToMyHeart가 2022년 George B. Moody PhysioNet 챌린지에 기여한 내용을 제시한다. 두 가지 모델을 구현하였다. 첫 번째 모델은 이중 베이지안 ResNet(DBRes)으로, 각 환자의 심장음 기록을 겹치는 로그 멜 스펙트로그램(log mel spectrogram)으로 분할한다. 이 스펙트로그램은 두 가지 이진 분류를 거치며, 각각 '존재 vs. 미확인 또는 부재', '미확인 vs. 존재 또는 부재'의 분류를 수행한다. 이러한 분류 결과를 통합하여 환자 수준의 최종 분류를 도출한다. 두 번째 모델은 DBRes의 출력에 인구통계학적 데이터와 신호 특징을 XGBoost를 사용해 통합한 것이다. DBRes는 은닉 테스트 세트에서 심장마음 분류 과제에서 최고의 가중 정확도 0.771을 기록하여, 심장마음 과제에서 4위를 차지하였다. (임상 결과 과제는 무시하였으나, 이 경우 비용이 12,637로 17위를 기록하였다.) 학습 데이터의 보류된 하위 세트에서 인구통계학적 데이터와 신호 특징을 통합함으로써 DBRes의 정확도는 0.762에서 0.820으로 향상되었으나, 가중 정확도는 0.780에서 0.749로 감소하였다. 본 연구 결과는 로그 멜 스펙트로그램이 심장음 기록에 효과적인 표현 방식임을 보여주며, 베이지안 네트워크가 강력한 지도 학습 분류 성능을 제공함을 입증한다. 또한, 삼분류 문제를 두 개의 이진 분류 문제로 처리하는 접근 방식이 가중 정확도 측면에서 성능 향상에 기여함을 확인하였다.