HyperAI超神経

浙江大学は、AAAI 2025に選出され、デジタル病理画像を用いて遺伝子発現を正確に予測する多対1回帰モデルM2OSTを提案した。

特色图像

デジタル病理画像は、全スライス病理画像(WSI)として、組織切片を高解像度でデジタル表示し、細胞の形態、構造、空間分布特性を総合的に表示できます。従来のガラススライドと比較して、WSI は保管や分析が簡単なだけでなく、複数のスケールでより直感的な組織ビューも提供します。そのため、病理診断や生物医学研究での利用が増えています。これらの画像を分析することで、研究者は細胞の空間構成と遺伝子発現の間の本質的なつながりを探ることができ、それによって多細胞システムにおける複雑な転写制御メカニズムを明らかにすることができます。

近年、単一細胞RNAシーケンシングの空間拡張技術としての空間トランスクリプトミクス(ST)は、細胞サブタイプの分布、相互作用、分子メカニズムを研究するための重要なツールとなっています。しかし、ST 技術は、設備や試薬のコストが高いため、実用化において普及が依然として困難です。それに比べて、WSI はより経済的で、臨床応用が容易です。そのため、ディープラーニングの助けを借りて低コストで WSI から ST マップを再構築する方法が、大きな注目を集める研究方向となっています。

既存の方法のほとんどは、ST 予測問題を従来の回帰問題として扱い、トレーニングに単一レベルの画像ラベル ペアを使用します。これにより、最大倍率の画像に対してのみ遺伝子発現関係をモデル化することしかできなくなり、WSI の固有のマルチスケール情報が無駄になります。

この問題に基づいて、中国浙江大学の林嵐芬教授の研究チームは、日本の浙江杭州志江研究室および立命館大学と共同で、異なるレベルの病理画像を用いて遺伝子発現を共同で予測することを目的とした多対一回帰トランスフォーマーモデル「M2OST」を共同で提案した。サンプリング ポイントの視覚情報と WSI のマルチスケール機能を統合することにより、モデルはより正確な ST マップを生成できます。さらに、研究チームは、多対一の多層特徴抽出プロセスを層内特徴抽出と層間特徴抽出に分離し、計算コストを大幅に削減し、モデルのパフォーマンスに影響を与えずに計算効率を最適化しました。

関連する結果は、「M2OST: デジタル病理画像から空間トランスクリプトミクスを予測するための多対一回帰」というタイトルで AAAI 2025 に選出されました。

研究のハイライト:* ST予測問題を多対1モデリング問題として概念化し、階層的WSIに埋め込まれたマルチスケール情報とポイント間特徴を使用してSTマップを共同予測する * 異なるシーケンス長の入力セットに対して堅牢な、多対1回帰に基づくTransformerモデルM2OSTを提案する
* M2OSTのマルチスケール特徴抽出プロセスをレイヤー内特徴抽出とレイヤー間特徴抽出に分離することで、モデルのパフォーマンスに影響を与えずに計算効率を大幅に向上させます。
* 提案されたM2OST法について包括的な実験が行われ、その有効性が3つの公開STデータセットで実証されました。

用紙のアドレス:
https://hyper.ai/cn/sota/papers/2409.15092
焦点を当てる ハイパーアルWeChatの公式アカウントで、バックステージで「M2OST」と返信すると、完全なPDFが手に入ります。

オープンソース プロジェクト「awesome-ai4s」は、200 を超える AI4S 論文の解釈をまとめ、膨大なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s

データセット: 3つのSTデータセットを使用してその有効性を実証する

研究チームは、提案された M2OST モデルのパフォーマンスを評価するために、3 つの公開 ST データセットを使用しました。

*ヒト乳がんデータセット(HBC):68 の WSI に 30,612 の遺伝子座が含まれており、各遺伝子座には最大 26,949 個の異なる遺伝子が含まれています。このデータセット内のポイントは直径が 100 μm で、中心間隔が 200 μm のグリッドに配置されています。

*ヒト陽性乳がんデータセット(HER2):36 枚の病理画像と 13,594 個のポイントで構成され、各ポイントには 15,045 個の遺伝子発現データが記録されています。このデータセット内の ST データの各キャプチャ ポイント間の中心距離は 200 μm で、各ポイントの直径は 100 μm です。

*ヒト皮膚扁平上皮癌データセット(cSCC):12 個の WSI と 8,671 ポイントが含まれます。このデータセットでは、各遺伝子座で 16,959 個の遺伝子が分析されました。すべてのドットの直径は 110 μm で、中心距離が 150 μm の中程度の長方形アレイに配置されています。

M2OSTモデル:多対1回帰構造、多階層病理画像が共同で遺伝子発現を予測

近年、全スライス病理画像 (WSI) から空間トランスクリプトーム (ST) プロファイルを予測することが、デジタル病理学の分野で研究のホットスポットになっています。 ST-Net や DeepSpaCE などの初期の方法では、畳み込みニューラル ネットワーク (CNN) に基づいて画像パッチ レベルで ST 予測を実行します。最近リリースされたバイモーダル埋め込みフレームワーク BLEEP は、WSI 画像パッチ機能を ST ポイント埋め込みと調整するための対照学習戦略を導入し、推論段階でのバッチ効果の問題を軽減するための K 最近傍アルゴリズムを導入しています。

Transformer ベースのモデルの登場により、そのパフォーマンスは従来の CNN を上回りました。ディープラーニング モデル HisToGene では、初めて Transformer を遺伝子発現予測に導入し、スライド レベルのモデリングを実現して効率性を向上させましたが、依然としてコンピューティング リソースによって制限されています。 Hist2ST モデルは、CNN、Transformer、グラフ ニューラル ネットワークを統合して、長距離の依存関係をさらに捕捉します。ただし、複雑なモデル構造により、過剰適合のリスクも高まります。

サンプリングポイント間の相関関係に着目する主流の考え方とは異なり、階層的画像特徴抽出に基づく手法であるiStarは、サンプリングポイント内の遺伝子発現が対応する画像ブロック領域とのみ関連していることを重視し、特徴抽出には事前トレーニング済みのHIPTを使用し、MLPを通じて発現値にマッピングすることで優れた性能を発揮します。ただし、これらの機能は学習可能ではないため、さらに最適化する余地が残っています。

これに触発されて研究チームはM2OST はイメージ ブロック レベルのソリューションも使用します。各予測の独立性と精度を確保するために、一度に 1 つのサンプル ポイントを予測します。研究チームはiStarのアイデアをさらに拡張し、学習可能なマルチスケールの特徴抽出および融合モジュールのセットを設計しました。地域の詳細モデリングとスケールを越えた情報統合により、複雑な組織構造下におけるモデルの予測能力が向上しました。

下の図に示すように、異なる全スライス病理画像 (WSI) レベルからの 3 つの画像パッチ シーケンスがモデルに入力され、対応する部位の遺伝子発現を共同で予測します。

3つの異なるレベルから病理学的画像ブロックを受け取った後、まず、M2OST はそれらを Deformable Block Embedding (DPE) レイヤーに入力します。適応型トークン生成を実現します。 DPE は、各画像から基本的な病理パッチを抽出するだけでなく、高レベルの病理画像に大きなサイズのパッチを導入して、より広範なコンテキスト情報を取得します。

同時に、DPE は細粒度のポイント内トークンと粗粒度の周囲トークンを生成し、モデルのサンプリング ポイントの中心領域の特徴への焦点を強化します。これにより、多対 1 モデリング プロセスでスポット間の特徴が強調され、後続の表現予測のためのより洗練された構造化された特徴表現が提供されます。

M2OSTモデル図

M2OSTで使用されるDPE

そして、各シーケンスに cls トークンが追加され、図の PE に示すように、学習可能な位置エンコーディングが導入されます。 M2OST は、内部トークン ハイブリッド モジュール (ITMM) を使用して、各シーケンスのレイヤー内機能を抽出します。 ITMM は Vision Transformer アーキテクチャ上に構築されており、画像モデリング プロセスにおけるモデルの一般化能力を強化するために Random Mask Self-Attention メカニズム (Rand Mask Self-Attn) を導入しています。

ITMMのネットワーク構造

レイヤー内特徴抽出が完了すると、M2OST はレイヤー間トークン混合モジュール (CTMM) を導入して、マルチレイヤーシーケンス間のレイヤー間情報相互作用を促進します。マルチスケール入力シーケンスの長さの違いにより、CTMM は、各スケール ブランチのパラメーターの相対的な独立性を維持しながら、直接融合によって引き起こされる情報の歪みを回避するために、完全に接続されたクロスレイヤー アテンション メカニズムを導入します。その後、チャネル レベルでのクロススケール情報交換機能を強化するために、M2OST は CTMM に続いてクロスレイヤー チャネル ミキシング モジュール (CCMM) を導入しました。

CCMM は、シーケンスの長さに影響されない構造設計を採用しています。CTMM は、異なるレイヤー間の注目度の類似性と学習可能な重みに基づいて、クロススケールのコンテキスト情報を動的に統合し、同じ形状の多層シーケンスを出力します。まず、各レイヤーのシーケンスに対してグローバル平均プーリングを実行し、そのシーケンス情報をトークン表現に圧縮します。次に、異なるレイヤーのトークンを組み合わせ、スクイーズインセンティブメカニズム(Squeeze & Excitation)と組み合わせて、クロスレイヤーチャネルアテンションスコアを計算します。これらのスコアはそれぞれの入力シーケンスにマッピングされ、チャネルレベルのスケール間情報交換が完了します。

(a) CTMMのネットワーク構造。 (b) CCMMのネットワーク構造。

このマルチスケール特徴モデリングプロセスは全体として M2OST のエンコーダーモジュールを構成し、ネットワーク全体で N 回反復され、空間トランスクリプトーム予測に必要なマルチレベルの高度な表現力を持つ画像表現を徐々に充実させます。やっと、3 つの cls トークンは接続され、ST ポイント予測の線形回帰ヘッドに送られます。

実験結果:多次元評価によりM2OSTモデルの有効性が証明された

研究チームは、複数のデータセットで M2OST のパフォーマンスをさまざまな主流の方法と総合的に比較しました。実験結果を次の表に示します。M2OST は、より少ないパラメータとより少ない FLOP で優れたパフォーマンスを実現します。ST-Net と比較すると、M2OST のパラメータ数は 0.40M 削減され、FLOP は 0.63G 削減され、HER2+ および cSCC データセットにおける M2OST のピアソン相関係数 (PCC) はそれぞれ 1.16% と 1.13% 改善されました。

M2OSTと他の手法の比較実験結果

M2OST と 1 対 1 のマルチスケール法の比較:

研究チームはまた、M2OST を CrossViT や HIPT/iStar などの一般的な 1 対 1 のマルチスケール手法と比較しました。標準 ViT と比較して、CrossViT はより強力な ST 回帰機能を示し、このタスクでマルチスケール情報を統合することの大きな利点を裏付けています。ただし、CrossViT はポイント内情報のモデリングにおいて一定の制限があり、全体的なパフォーマンスは依然として M2OST に劣ります。

さらに、iStar は ST 予測精度においても優れたパフォーマンスを発揮し、WSI からマルチスケール特徴を抽出する際の HIPT アーキテクチャの有効性を実証しています。ただし、計算コストを節約するために、iStar は固定の HIPT 重みを使用して ST 予測用の WSI 特徴を生成するため、特徴抽出機能が制限されます。同時に、推論効率の面では、iStar のブロック単位、スケール単位の抽出プロセスにより、処理時間が大幅に増加します。研究結果によると、同じ GPU メモリ制限内で実行した場合、M2OST の推論速度は iStar より約 100 倍速く、そのパフォーマンスは後者よりもさらに優れていることが示されており、ST 回帰タスクにおけるエンドツーエンドのトレーニングの可能性と M2OST モデルの有効性が十分に実証されています。

画像パッチレベルとスライドレベルの ST 方法の比較:

実験結果によると、3 つのデータセットにおけるスライド レベルの方法のパフォーマンスは、一般的に画像ブロック レベルの方法よりも劣っています。 Hist2ST は HisToGene よりも優れたパフォーマンスを示しますが、パラメータ数が多く FLOP が高いため、このパフォーマンスの向上はわずかです。 ST-Net などのベースライン画像ブロック レベルの方法と比較すると、3 つのデータセット上の Hist2ST の PCC はそれぞれ 2.78%、2.99%、2.66% 削減されます。これは、ある点の遺伝子発現が主にそれに対応する組織領域に関連しており、点間の相関関係を導入しても予測精度が大幅に向上しないことを示しています。それでも、スライドレベル法は完全な ST マップを生成する上でより効率的であり、将来的にはネットワーク設計を最適化することで競争力のある回帰精度を達成できる可能性があります。

視覚分析:

(a) 主成分分析 (PCA) 後の空間トランスクリプトーム (ST) プロファイルの可視化。 (b) DDX5遺伝子の空間分布の可視化。

研究チームは、ST マップ予測におけるさまざまな手法の視覚化結果を分析および比較しました。結果は、スライド レベルの方法 (HisToGene や Hist2ST など) では通常、より滑らかなマップを生成できる一方、画像ブロック レベルの方法ではより明確なローカル構造特徴が保持されることを示しました。

注目すべきは、M2OST が常により正確な ST マップを生成し、より高い予測精度を実現できることです。研究チームはさらに、β-カテニンシグナル伝達経路を活性化することで非小細胞癌細胞の増殖と腫瘍形成に重要な役割を果たす鍵遺伝子DDX5の発現を可視化した。結果は、M2OST がこの遺伝子の予測において最も優れたパフォーマンスを発揮し、比較したすべての方法を上回り、単一遺伝子発現予測レベルでの M2OST モデルの精度を検証したことを示しました。

空間トランスクリプトミクスの画期的な進歩と分野横断的な応用

空間トランスクリプトミクスは、細胞機能と組織構造を結びつける橋渡しとして、時間と空間における個々の細胞の遺伝子発現パターンを分析し、細胞集団の空間的位置と生物学的特性を明らかにすることで、生物医学研究をより深いレベルに推進します。

この地域では、2025年4月までに、東京大学医科学研究所の研究チームは、画像支援グラフコントラスト学習に基づく空間トランスクリプトミクス解析用のディープラーニングフレームワーク STAIG を開発しました。このフレームワークは、データを整列させる必要なく遺伝子発現、空間データ、組織学的画像を統合できるため、バッチ効果を排除し、空間領域を識別する従来の方法の限界を克服できます。 STAIG は、事前トレーニング用の大規模なデータセットに依存せずに、自己教師学習を通じてヘマトキシリンおよびエオシン (H&E) 染色画像から特徴を抽出します。

トレーニング中、STAIG はグラフ構造を動的に調整し、組織学的画像を通じて無関係なネガティブサンプルを選択的に除外して、バイアスを削減します。最終的に、STAIG は、ローカル比較を通じて遺伝子発現の共通性を分析することでバッチ統合を成功させ、手動による座標調整の複雑さを回避し、バッチ効果を大幅に削減しました。研究では、STAIG は複数のデータセット、特に空間領域の識別において優れたパフォーマンスを発揮し、腫瘍の微小環境における詳細な遺伝的および空間的情報を明らかにできることが示されており、空間生物学の複雑さを分析する上で重要な可能性を実証しています。

詳細レポートを見るにはクリックしてください: バッチ効果を排除するための事前アライメントは不要で、東京大学のチームは腫瘍微小環境の詳細な遺伝情報を明らかにするディープラーニングフレームワークSTAIGを開発しました。

同時に、中国上海臨港研究所のウェイ・ウー氏の研究チームも空間トランスクリプトミクスの分野で大きな進歩を遂げました。 2024年11月、研究チームは「MCGAE:統合マルチモーダル空間トランスクリプトミクスによる腫瘍浸潤の解明」と題する研究論文をBriefings in Bioinformatics誌に発表した。この研究では、空間トランスクリプトームデータ分析専用に設計されたディープラーニングフレームワーク MCGAE (Multi-View Contrastive Graph Autoencoder) を開発しました。このフレームワークは、遺伝子発現、空間座標、画像特徴を組み合わせることで、マルチモーダル、マルチビューの生物学的表現を作成し、空間領域認識の精度を大幅に向上させます。腫瘍データは、腫瘍領域の正確な識別と分子調節特性の詳細な分析を示しており、複雑な組織の研究、疾患のメカニズムの研究、薬物ターゲットの発見のための強力なツールを提供します。

原紙:
https://academic.oup.com/bib/article-pdf/26/1/bbae608/60786360/bbae608.pdf

さらに、農業における空間トランスクリプトミクスの応用も大きな可能性を示しています。 2025年4月、北京大学現代農業研究所の研究チームが「時空間トラノミクスが小麦の穀物収量と品質の重要な遺伝子制御を明らかにする」と題する重要な研究をゲノム生物学誌に発表しました。空間トランスクリプトーム技術を使用して、初期発育のさまざまな時期における小麦粒の高解像度遺伝子発現マップが構築されました。小麦の穀粒発育中の遺伝子発現特性を明らかにしました。この研究は、小麦の分子設計育種と収穫量向上に重要な理論的裏付けを提供するだけでなく、世界の食糧安全保障に強力な保証を提供します。

原紙:
https://www.biorxiv.org/content/biorxiv/early/2024/06/03/2024.06.02.596756.full.pdf

今後、空間トランスクリプトームデータの継続的な蓄積とデジタル病理画像取得方法の継続的な最適化により、人工知能とオミックス技術の深い統合により、さまざまな組織タイプと疾患背景でのディープラーニングモデルの広範な応用が促進され、精密医療の発展に役立ちます。 M2OST の提案は、効率的で低コスト、高精度の空間遺伝子発現予測フレームワークを構築するための強固な基盤を築き、バイオメディカル分野における人工知能とマルチオミクスデータ融合分析の大きな展望を告げています。