背景:睡眠覚醒(sleep arousals)とは、睡眠中に一時的に覚醒状態が現れる一時的な期間を指す。過剰な睡眠覚醒は日中の眠気や睡眠障害を引き起こすなど、さまざまな悪影響と関連している。睡眠覚醒障害の診断において、多導睡眠図(polysomnographic recordings)の高品質なアノテーションが極めて重要である。現在、睡眠覚醒は主に人間の専門家が数百万ものデータポイントを手動で確認してアノテーションを行うことで行われており、これには膨大な時間と労力が要されている。方法:本研究では、2つの独立したデータセット(i)PhysioNet Challengeデータセット(n=994)、(ii)Sleep Heart Health Studyデータセット(n=2000)の合計2,994人の多導睡眠図を用い、モデルの学習(60%)、検証(15%)、テスト(25%)に分けて使用した。我々は、深層畳み込みニューラルネットワーク(deep convolutional neural network)を用いた新しい手法「DeepSleep」を開発し、睡眠覚醒イベントを自動的にセグメンテーションした。本手法は、複数の時間スケールにおいて生理信号間の長距離および短距離の相互作用を捉えることで、睡眠覚醒の検出能力を強化した。さらに、類似した生理信号チャネルをランダムに交換する新しいオーグメンテーション戦略を導入し、予測精度の向上を図った。結果:他の睡眠研究における計算手法と比較して、DeepSleepは高い精度(受信者操作特性曲線下面積:0.93、精度-再現率曲線下面積:0.55)、高解像度(5ミリ秒解像度)、高速(1睡眠記録あたり10秒)な睡眠覚醒の区画化を実現した。2018年PhysioNet Challengeにおいて、大規模なホールドアウトデータセット(n=989)を用いた評価で、非睡眠時無呼吸性覚醒(non-apneic arousals)のセグメンテーションにおいて首位を獲得した。また、DeepSleepは特に覚醒と非覚醒イベントの境界領域(低信頼度領域)において、人間によるアノテーションよりも詳細な区切りを提供することが明らかになった。これは、イン・シリコ(in silico)でのアノテーションが人間によるアノテーションを補完する可能性を示しており、現在の二値ラベルシステムおよび覚醒のスコアリング基準の進化に寄与する可能性があることを示唆している。解釈:提案された深層学習モデルは、睡眠覚醒の検出において最先端の性能を達成した。アノテーションの信頼度確率を導入することで、睡眠障害の診断や睡眠品質の評価に向けたより正確な情報を提供する可能性がある。