
事前学習は、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像などの機械学習の異なる分野で成功を収めてきました。しかし、臨床データ分析におけるその可能性はまだ十分に探索されていません。小規模な病院でデータが収集される場合や稀少疾患に関連する場合など、電子健康記録(EHR)データの量とラベルが不足することがあります。このようなシナリオでは、より大規模なEHRデータでの事前学習がモデル性能の向上につながる可能性があります。本論文では、患者アウトカム予測のために異種多様なマルチモーダルEHRデータに対して非教師あり事前学習を適用します。このデータをモデル化するために、人口グラフ上のグラフ深層学習を利用します。まず、連続値、離散値、時系列特徴量など、EHRデータに含まれるさまざまな入力特徴量タイプに対応できるように設計されたグラフトランスフォーマーに基づいたネットワークアーキテクチャを設計します。これにより、より効果的なマルチモーダルデータ融合が可能になります。さらに、マスクインポーテーションに基づく事前学習方法を設計し、異なる最終タスクへの微調整前にネットワークを事前学習させます。事前学習は完全に非教師ありで行われており、これにより将来、異なるタスクや類似したモダリティを持つ大規模な公開データセットでの事前学習の基盤が築かれます。我々は提案手法を2つの医療データセットであるTADPOLEおよびMIMIC-IIIでテストしました。これらのデータセットには画像と非画像の特徴量が含まれており、異なる予測タスクも扱っています。結果として、提案したグラフベースの事前学習手法は人口レベルでのデータモデリングに役立ち、微調整タスクにおいて平均的にMIMICではAUC(受信者操作特性曲線下面積)を4.15%向上させ、TADPOLEでは7.64%向上させることが確認されました。