高度グラフニューラルネットワークを用いたがん分類のための多オミクス統合の比較解析

多オミクスデータは、がん分類のための計算手法の進歩にますます利用されるようになっています。しかし、多オミクスデータの統合には、高次元性、データの複雑さ、およびさまざまなオミクスタイプの独自性という大きな課題があります。本研究ではこれらの課題に対処し、グラフ畳み込みネットワーク(GCN)、グラフアテンションネットワーク(GAT)、およびグラフトランスフォーマーネットワーク(GTN)を基盤とする3つのグラフニューラルネットワークアーキテクチャを評価しました。これらは31のがん種と正常組織を分類するために使用されました。多オミクスデータの高次元性に対処するため、特徴選択としてLASSO(Least Absolute Shrinkage and Selection Operator)回帰を使用し、LASSO-MOGCN、LASSO-MOGAT、およびLASSO-MOTGNモデルを作成しました。ネットワークのグラフ構造は、遺伝子相関行列とタンパク質-タンパク質相互作用ネットワークを使用して、メッセンジャー-RNA、マイクロ-RNA、およびDNAメチル化データの多オミクス統合のために構築されました。このようなデータ統合により、ネットワークは生物学的エンティティ間の重要な関係に動的に焦点を当てることができ、モデル性能と解釈可能性が向上します。モデルの中で特にLASSO-MOGATは相関に基づくグラフ構造で最先端の精度(95.9%)を達成し、LASSO-MOGCNやLASSO-MOTGNモデルよりも精度、再現率、F1スコアにおいて優れた結果を示しました。我々の研究結果は、グラフベースのアーキテクチャで多オミクスデータを統合することでがん分類性能が向上し、異なる分子パターンを明らかにすることによってがん生物学への理解深化と疾患進行に関する潜在的なバイオマーカー探索に貢献することを示しています。