HyperAI超神経

上級病理医にも負けないレベルです!清華大学チームが神経膠腫の正確な診断を実現するAI基本モデルROAMを提案

特色图像

神経膠腫は、脳内のグリア細胞に由来する腫瘍であり、中枢神経系原発腫瘍全体の 40% ~ 60% を占め、成人に最も多い頭蓋内原発腫瘍として知られています。神経膠腫の組織病理学的分類は非常に複雑で、一般に星状細胞腫、希突起膠腫、上衣腫の 3 つのサブタイプに分類され、それぞれはさらにいくつかのグレードに分類できます。したがって、正確な分類と等級付けは、神経膠腫の予後評価と治療計画に不可欠です。

神経膠腫の診断は通常、経験豊富な病理医が組織切片を観察して行いますが、このアプローチには病理医の不足、主観的な診断、診断プロセスに時間がかかるなどの課題があります。現在の神経膠腫の診断ニーズを満たすことは困難です。

デジタル病理学と機械学習の最近の進歩により、組織学的スライドのデジタル化が可能になり、診断、予後、分子プロファイリングのための豊富なコンテキスト データを含むギガピクセルの全スライス画像 (WSI) に変換されます。これには大きな可能性があります。ただし、これらの方法は、病理医が選択した病理画像内の関心領域 (ROI) のみを分析します。スライス全体の自動分析は不可能です。

この文脈では、清華大学オートメーション学部の生命基本モデル研究室の准研究員、Lu Hairong、Jiang Rui教授、Zhang Xuegong教授は、中南大学Xiangya HospitalのHu Zhongliang教授と共同研究しました。神経膠腫の臨床レベルの診断や分子マーカー発見に利用され、他の領域にも拡張可能なラージ・オブ・インタレスト(大関心領域)とPyramid Transformer(ピラミッド・トランスフォーマー)に基づく精密病理診断AI基本モデルROAMを提案腫瘍の種類の病理学的診断。

関連する研究結果は、「臨床グレードの診断および神経膠腫の分子マーカー発見のためのトランスフォーマーベースの弱教師計算計算病理学法」というタイトルで Nature Machine Intelligence に掲載されました。

ROAM は、病理画像から豊富なマルチスケール情報を効果的に抽出し、神経膠腫腫瘍の検出、サブタイプ分類/グレーディング、分子特徴予測などのさまざまな分類タスクの正確な診断を実現します。ROAM の診断パフォーマンスは内部データにおいて優れており、病理学者の経験と一致する重要な形態学的特徴を自動的に捕捉し、正確で信頼性が高く適応性のある臨床グレードの神経膠腫診断を提供します。

さらに、ROAM は独立した外部データに一般化でき、優れた一般化機能を備えています。 ROAM は、診断を視覚化して説明することで、病理医がモデル診断基盤の信頼性を検証し、貴重な情報を抽出し、医療を改善するための補助診断を促進するのに役立ちます。最も重要なことは、ROAM は分子および形態学的バイオマーカーの発見を促進し、神経膠腫の診断と治療に対する新たな洞察を提供することです。

研究のハイライト:

* ROAM は、大きなサイズの画像ブロックとマルチスケールの特徴学習モジュールを通じて、スライス全体の組織病理画像の視覚的表現の効率的な抽出を実現します

* ROAM は独立した外部データに一般化でき、優れた一般化機能を備えています

* ROAM は分子および形態学的バイオマーカーの発見に役立ち、神経膠腫の診断と治療に新たな洞察を提供します

用紙のアドレス:
https://www.nature.com/articles/s42256-024-00868-w

データセットのダウンロード:

https://go.hyper.ai/r7CyI

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、大規模なデータ セットとツールを提供します。

https://github.com/hyperai/awesome-ai4s

データセット: 2 つの主要なデジタル組織病理学スライド データ セット

この研究では、神経膠腫研究のために 2 つの大規模デジタル組織病理学的切片 (WSI) データ セットを収集しました。

1. Xiangya 神経膠腫 WSI データセット

このデータセットは、中南大学翔雅病院の神経膠腫切片から得たものです。以下の図に示すように、同じ数の異なる症例を倍率 40 倍で処理した 1,109 個の WSI が含まれており、神経膠腫の検出、サブタイプ分類、グレーディング、分子特徴予測などの診断タスクをカバーしており、各症例で収集されたスライスの数同じです。

Xiangya 神経膠腫 WSI データセット情報

データセットには、530 個の星状膠腫、224 個の希突起膠腫、および 213 個の上衣腫のサブタイプとグレードを示すスライスレベルの注釈のみが含まれています。さらに、634 件の IDH 変異症例と 641 件の MGMT プロモーターメチル化症例に対して分子検査が実施されました。

データセットはランダムに 2 つの部分に分割されます。736 個の WSI を含む内部トレーニング データセットはモデルのトレーニングに使用され、もう 1 つはモデルの評価と医師関連の実験用の 373 個の WSI を含む内部テスト データセットです。両方のデータセットのカテゴリの割合は、データセット全体と同じです。

2. TCGA 神経膠腫 WSI データセット

もう 1 つの神経膠腫組織病理学 WSI データセットは、Brain Low-Grade Glioma and Glioblastoma Project から提供されています。860 個の膠芽腫切片 (389 例から) と 844 個の低悪性度神経膠腫切片 (491 例から) があります。診断基準は Xiangya データセットで使用されているものとは異なるため、データ内のもののみがスライスレベルで保持されます。また、Xiangya データセットのアノテーションに参加した 2 人の病理学者を招待し、2016 年版の診断ガイドラインに従ってこれらのスライスの診断結果をレビューおよび修正してもらいました。

最後に、レビューされたデータセットには倍率 40 倍および 20 倍の 618 個の WSI が含まれており、Xiangya データセットと一致する 4 つのタスクをカバーしています。このデータセットは、神経膠腫のサブタイプ分類、グレーディング、分子サイン予測のための外部テスト データセットとして機能します。

モデル アーキテクチャ: 大面積関心とピラミッド トランスフォーマーに基づく

ROAM は、弱く教師付きの計算病理学手法です。、この方法は、基本フレームワークとしてマルチインスタンス学習を使用し、基礎研究単位として大きなサイズの組織画像ブロックを使用し、ピラミッドトランスフォーマーを使用して各組織パッチのスケール内およびスケール間の相関特徴を体系的に学習し、それによって達成します包括的 組織切片画像から視覚的表現を効率的に抽出します。

初め、ROAM は、各全スライス画像に対して組織セグメンテーションを実行し、次の WSI パッチング図に示すように、後続の分析の基本単位、つまり ROI として大きなサイズの組織画像ブロック (2048 x 2048) を抽出します。

ROAMの基本フレームワーク

第二に、各 ROI に対して 2 つの連続したダウンサンプルを実行して、倍率の異なる 3 つの画像を生成します。次に、各画像は小さな画像パッチに分割され、これらの画像パッチは事前にトレーニングされた畳み込みニューラル ネットワークを通じてエンコードされ、これらの画像表現は MIL モデルへの入力として使用されます (左の図 b)。特徴抽出抽出); 図の右側のマルチスケール特徴抽出に示すように、マルチスケール セルフ アテンション (SA) モジュールとアテンション ネットワークを使用してインスタンス レベルの表現を生成し、この情報をスライス レベルの表現に集約します。 bを以下に示します。

インスタンス特徴抽出とマルチスケール特徴抽出

やっと、以下の図 c のインスタンス フィーチャの集約に示すように、2 つの異なるタイプの SA モジュールは、ピラミッド トランスフォーマー アーキテクチャを使用して、高倍率から低倍率までマルチスケール フィーチャを段階的に融合し、組織パッチのマルチスケール視覚表現を取得します。スケール内 SA モジュールとスケール間 SA モジュールは、それぞれ ROI のスケール内およびスケール間の相関特徴を学習します。両方のモジュールには、いくつかのマルチヘッド SA 層とフィードフォワード層が含まれています。

インスタンス機能の集約

研究結果:ROAMで神経膠腫の正確な診断を実現

ROAMは神経膠腫の正確な診断を実現します

研究者らは、内部データセットと TCGA 外部データセットに対する ROAM の分類パフォーマンスを評価しました。

以下の図 a に示すように、ROAM は CLAM、TransMIL、GTP、TEA-graph、H(2)MIL を含む 5 つの方法よりも優れており、内部データ セットの神経膠腫診断に関連するタスクでは他のベースライン方法よりも優れています。 ROAM のマクロ平均 1 対 1 ROC 曲線下面積 (AUC) は、正常、神経膠症、腫瘍性の 3 種類の神経膠腫の検出において 0.990±0.002 でした。

神経膠腫の分類

星状細胞腫、希突起膠腫、および上衣腫の 3 つの神経膠腫サブタイプ分類では、以下の図 b に示すように、ROAM の AUC は 0.950±0.003 でした。

星状細胞腫のグレード

これらの神経膠腫診断タスクの中で、ROAM はすべてのベースライン方法の中で最高の AUC を達成します。神経膠腫診断における ROAM モデルの有効性と高いパフォーマンスが実証されました。

同時に、ROAM には優れた汎化特性もあります。外部 TCGA データセットでのトレーニングとテストに内部データセットのみを使用しても、ROAM は全体として他のベースライン手法よりも優れたパフォーマンスを示します。また、ROAM 予測の視覚的な結果は、この方法によって要約された診断根拠が臨床診断基準と非常に一致していることも示しています。

ROAM は神経膠腫の臨床補助診断を大幅に進歩させます

研究者らは ROAM の臨床グレードの包括的な評価を実施しました。そして、神経膠腫の補助診断における ROAM のパフォーマンスを研究しました。5 人の病理医からなる 3 つのグループが研究に参加するよう招待され、1 つのグループは臨床経験が 5 年未満の若手病理医で、他の 2 つのグループは臨床経験が 5 ~ 15 人でした。残りの 2 つのグループは 15 年以上の臨床経験を持つ上級病理医でした。

以下の図に示すように、提案されたシステムは神経膠腫カスケード診断の 5 つのタスクで良好なパフォーマンスを示し、病理医 5 人中 4 人を上回り、最も成績の良かった上級病理医 (シニア 1) に匹敵する結果を達成しました。具体的には、神経膠腫の検出に関しては、新しいシステムはすべての病理学者を大幅に上回りました。以下の図 f に示すように、21.30% を超えて成績上位の病理医も含まれます。

人間とコンピュータの比較結果

次に研究者らは、3人の若手および中堅病理医にROAMの支援を受けて診断を依頼し、診断性能が向上したかどうかを調査した。結果は、ROAM の助けにより、3 人の病理医の診断精度がすべてのタスクで平均 7.27% (初級 1)、12.87% (中級 1)、および 9.96% (中級 2) 向上したことを示しています。これは、ROAM の臨床応用価値が非常に大きいことを反映しています。

ROAM は神経膠腫の分子形態学的マーカーの発見を促進します

研究者らは、ROAM を使用して、神経膠腫の診断に関連する主要な分子的特徴の形態学的発現を調査しました。彼らは、ROAM がイソクエン酸デヒドロゲナーゼ (IDH) 変異の分子的特徴を予測するタスクで良好に機能することに気づき、このタスクにおける ROAM のパフォーマンスに興味を持ちました。私たちは、予測結果の完全な視覚的分析を実施し、ROAM が焦点を当てている注目度の高い主要領域の組織形態学的特徴を分析および要約しました。その結果、好酸球の増加、均一な細胞質、および深く染色された核が病理学的によく見られることがわかりました。 IDH 変異現象の画像。

びまん性星状細胞腫と希突起膠腫に基づくこれらの ROI の視覚化により、IDH 変異を持つ神経膠腫の独特の特徴が明らかになります

この重要な発見は、医師が分子検査に頼ることなくIDHの状態を予備的に予測するのに役立ち、神経膠腫の臨床診断基準の最適化と改善を大きく前進させるでしょう。

清華大学オートメーション学部の基礎生命モデル研究室は、AI を活用した生命科学研究を推進し続けています

この論文では、清華大学准研究員のLu Hairong氏、中南大学襄雅病院のZhang Xuegong教授、Hu Zhongliang教授が責任著者である。清華大学のJiang Rui教授と修士課程のYin Xiaoxu、中国移動研究所のYang Pengshuai、Xiangya HospitalのCheng Lingchaoは、この論文の共同筆頭著者である。 、Li Liling、Lin Wei、Zhou Huan が参加 この研究のデータ収集と注釈付けのために、Chen Fujie と福州データ技術研究所はオンライン ソフトウェア プラットフォームの研究開発サポートを提供しました。

この研究への主要な貢献者の一人として、清華大学オートメーション学部の基礎生命モデル研究室は、高度な人工知能技術を使用して生命科学研究を強化する方法を探求することに常に取り組んでいます。

今年6月、清華大学オートメーション学部基礎生活モデル研究室所長のZhang Xuegong教授、エレクトロニクス/AIR学部のMa Jianzhu教授、Baitu BiotechnologyのSong Le博士が協力して、scFoundation という名前の大きな細胞モデルが構築されました。このモデルは 5,000 万個の細胞からの遺伝子発現データに基づいてトレーニングされており、1 億個のパラメーターを持ち、約 20,000 個の遺伝子を同時に処理できます。基本モデルとして、「仮想薬物試験」などのさまざまな生物医学の下流タスクで優れたパフォーマンスの向上を示しています。単一細胞研究における人工知能の新しいパラダイムを提供します。

研究成果は、「単一細胞トランスクリプトミクスに関する大規模基礎モデル」というタイトルでNature Methods誌に掲載された。クリックするとレポート全文が表示されます: 「1 億個のパラメーターを備えた大規模細胞モデルが登場しました! Nature サブジャーナルで、清華大学のチームが scFoundation: 20,000 個の遺伝子の同時モデリングを発表しました。」

scFoundation モデルと下流のアプリケーション シナリオ

scFoundation モデルは、ライフ サイエンスの基礎研究、細胞摂動応答予測、創薬標的発見などの分野に革新的な手法ツールを提供します。また、モデル アーキテクチャ、トレーニング フレームワーク、および下流のデモンストレーションの観点から、大規模細胞モデルの研究に新しいアイデアを提供します。この応用システムは、単細胞分野における基本モデルの境界を拡張することに成功し、数値ベースの空間での仮想薬物実験などの将来の研究の基礎を築きました。

清華大学オートメーション学科の生命基本モデル研究室は、未来に向けて人工知能と生命科学の接点における研究を続けていきます。 AI技術の継続的な開発と改善により、ライフサイエンス分野での人工知能の応用は医療技術の進歩を大きく促進し、診断と治療の精度を向上させ、医療費を削減し、最終的には人間の健康と医療の質を向上させるでしょう。人生。

参考文献:
1.https://www.nature.com/articles/s42256-024-00868-w

2.https://mp.weixin.qq.com/s/oB3kTgcgObawPKU-75KsHQ

3.https://mp.weixin.qq.com/s/nflI4PVTJB3xVPXuA5zbZQ

召喚命令

HyperAI (hyper.ai) は、データサイエンス分野における中国最大の検索エンジンであり、科学のための AI の最新の研究結果に長年重点を置き、トップジャーナルに掲載された 100 以上の学術論文を解釈してきました。

AI for Science に関する研究と探求を行っている研究グループや研究チームから、最新の研究結果を共有したり、詳細な解釈の記事を提出したり、AI4S のライブ ブロードキャスト コラムに参加したりするための連絡を歓迎します。AI4S を促進するその他の方法は次のとおりです。一緒に探検するのを待っています!

WeChat を追加: PH (WeChat ID: G18539589505)