伝統的な機械学習を軽視するな:単純で解釈可能な手法は、睡眠スコアリングにおいて深層学習と競争力がある

最近数年、自動睡眠スコアリングの研究は主にますます複雑な深層学習アーキテクチャの開発に焦点を当ててきました。しかし、最近これらの手法は僅かな改善しか達成できず、しばしばより多くのデータと高価な学習プロセスを必要とするという代償がありました。これらの努力と満足できる性能にもかかわらず、自動睡眠ステージングソリューションはまだ臨床的な文脈で広く採用されていません。私たちは、大部分の深層学習による睡眠スコアリングソリューションが訓練、展開、再現が難しく、実世界での適用性に制限があると考えています。さらに、これらのソリューションには解釈可能性と透明性が欠けており、これらはしばしば採用率を向上させる上で重要な要素です。本研究では、古典的な機械学習を使用して睡眠ステージ分類の問題を見直します。結果は、前処理、特徴量抽出、そして単純な機械学習モデルから構成される従来の機械学習パイプラインでも競争力のある性能が得られることを示しています。特に、線形モデルと非線形(勾配ブースティング)モデルの性能を分析しました。私たちの手法はSleep-EDF SC-20 (MF1 0.810)とSleep-EDF ST (MF1 0.795)の2つの公開データセットで最先端の手法(同じデータを使用)を超える一方で、Sleep-EDF SC-78 (MF1 0.775)とMASS SS3 (MF1 0.817)でも競争力のある結果を得ています。私たちは、睡眠ステージスコアリングタスクにおいてエンジニアリングされた特徴ベクトルの表現力が深層学習モデルが内部的に学習した表現と同等であることを示しました。この観察は臨床的な採用への道を開きます。なぜなら代表的な特徴ベクトルを利用することで、伝統的な機械学習モデルの解釈可能性と成功例を活用できるからです。