
要約
睡眠科検査施設における自動覚醒検出の応用を目指して、当大学病院睡眠科での日常的業務から得られたデータを用いて、最適化された最先端のアプローチを評価した。そこで、多様な睡眠障害を有する3,423例の多導睡眠図(polysomnograms)を用いて、機械学習アルゴリズムの学習と評価を行った。モデル構造は、50 Hzの信号を入力として扱えるU-netアーキテクチャを採用した。本研究では、公開データセットで学習されたモデルと比較し、臨床データセットを用いてその性能を評価した。特に、異なる睡眠障害がモデル性能に与える影響に注目した。臨床的意義の評価を目的として、予測された覚醒指数の誤差に基づく評価指標を設計した。本研究で開発したモデルは、精度-再現率曲線下の面積(AUPRC)最大0.83、F1スコア最大0.81を達成した。自らのデータで学習したモデルは、年齢や性別に対するバイアスがなく、健康な睡眠状態と比較して睡眠障害の有無がモデル性能に有意な悪影響を及ぼさなかった。一方、公開データセットで学習されたモデルは、睡眠障害の有無がモデル性能にわずかから中程度の悪影響を及ぼす傾向(Cohen's dを用いて算出)を示した。以上から、本研究のモデルアーキテクチャを用いることで、臨床データ上で最先端の覚醒検出が可能であると結論づけた。したがって、本研究の結果は、モデルを臨床データに適用する場合、臨床データを用いた学習が一般的に推奨されるべきであることを裏付けている。