Dreem Open Datasets: 다중 점수화된 수면 데이터셋으로 인간과 자동화된 수면 단계 분류를 비교하다

수면 단계 분류는 수면 장애 진단의 중요한 요소를 구성합니다. 이는 훈련된 수면 기술자가 다중 수면 검사(Polysomnography) 기록을 시각적으로 검토하여 수행됩니다. 자동화된 접근 방식은 이러한 자원 집약적인 작업을 완화하기 위해 설계되었습니다. 그러나 이러한 접근 방식은 일반적으로 상호 평가자 일치도가 약 85%에 불과한 단일 인간 평가자의 주석과 비교됩니다. 본 연구에서는 25명의 건강한 자원봉사자를 포함하는 DOD-H 데이터셋과 55명의 협착성 수면 무호흡증(Obstructive Sleep Apnea, OSA) 환자를 포함하는 DOD-O 데이터셋을 공개하였습니다. 두 데이터셋 모두 다른 수면 센터에서 5명의 수면 기술자들이 점수를 매겼습니다. 우리는 여러 인간 평가자의 합의와 자동화된 접근 방식을 비교하기 위한 프레임워크를 개발했습니다. 이 프레임워크를 사용하여 문헌에서 제시된 주요 접근 방식들을 벤치마킹하고 비교했습니다. 또한, 최신 최고 성능(SOTA, State-of-the-Art) 방법론에서 영감을 받은 새로운 딥러닝 방법인 SimpleSleepNet을 개발하고 벤치마킹했습니다. 우리는 많은 방법이 두 데이터셋 모두에서 인간 수준의 성능을 달성할 수 있음을 입증했습니다. SimpleSleepNet은 DOD-H에서 인간 평가자들의 평균 F1 점수 86.8% 대비 89.9%의 F1 점수를, DOD-O에서는 84.8% 대비 88.3%의 F1 점수를 달성했습니다. 본 연구는 최신 자동화된 수면 단계 분류 방법이 건강한 자원봉사자와 OSA 환자 모두에서 인간 평가자의 성능을 능가함을 강조합니다. 임상 환경에서 자동화된 접근 방식의 활용성을 고려해볼 만하다는 결론을 내렸습니다.