2024年2月、国立がんセンターは腫瘍登録と追跡調査の最新データに基づいて「2022年の中国におけるがん罹患率と死亡率」報告書を作成した。この報告書は、肺がんが依然として我が国における悪性腫瘍の罹患率と死亡の主な原因であることを示しています。医学界の肺がんへの注目は高まっていますが、肺がんの診断と治療の分野では診断の遅れや過剰治療などの臨床上の問題が依然として数多くあります。過去 10 年間、アルゴリズムの改善、計算能力の向上、利用可能なデータの拡大、アプリケーションの範囲の劇的な拡大により、AI は前例のない速度で技術開発の方向をリードしています。
Google は、AI 研究開発の最前線に立つ世界クラスのテクノロジー巨人の 1 つとして、AI と医療応用の研究で多大な成果を上げてきました。最近、Google Research のソフトウェア エンジニアである Atilla Kiraly とプロダクト マネージャーの Rory Pilgrim は、機械学習モデルが研究結果を放射線科医に効果的に伝える方法を研究しました。肺がんスクリーニング (LCS) ワークフローに対する汎用人工知能支援システムの影響が、特定のワークフロー コンテキスト、デバイス、国固有のガイドラインおよびスコアリング/管理プロトコル内で評価されました。この研究論文は、Radiology AI誌に掲載されました。
研究のハイライト:
* 人工知能支援による肺がんスクリーニングのワークフローを開発および最適化し、米国と日本でテストしました
* 人工知能の支援により、感度を大幅に低下させることなく、5% ~ 7% によって特異性を向上させることができます。
* 人工知能の支援により、各症例の平均スクリーニング時間が 14 秒短縮され、医師の診断の信頼性が大幅に向上しました。
用紙のアドレス:
https://doi.org/10.1148/ryai.230079
公式アカウントをフォローし、バックグラウンドで「Google Lung Cancer」に返信すると、全文の PDF が表示されます
この研究では、合計 5 つの独立したデータセット (DS_CA、DS_NLST、DS_US、DS_JPN) を使用し、米国と日本の合計 627 件 (癌陽性 141 件を含む) の低線量胸部 CT 症例を分析しました。このうち米国の研究には、男性191人、女性139人を含む、年齢中央値63歳の患者330人が参加した。日本の研究には、男性217人、女性80人を含む297人の患者が参加し、年齢中央値は58歳であった。陽性例は 2 年以内に肺がんの病理学的診断があった場合と定義され、陰性例は少なくとも 2 年間がんの確定診断がなかった場合と定義されました。
同時に、この研究には、胸部CT検査の読影経験のある米国の胸部認定放射線科医6名と日本の認定放射線科医6名も参加した。この研究では、すべての症例のCTスキャンが12人の医師によって人工知能の支援ありまたはなしで1回検査され、合計7,254回の読影が行われた。国固有のスコアリング システムについては、米国の放射線科医は米国放射線学会ガイドライン (バージョン 1.1) の Lung-RADS スコアを使用し、日本の放射線科医はセンダイ スコアリング システムを使用しました。
がん陽性症例141人のうち、124人が米国、17人が日本であった。このうち、米国における陽性症例の結節の状態は、充実性結節が 69 件(56%)、部分充実性結節が 15 件(12%)、非充実性結節が 20 件(15%)、および 29 件であることを示しています。未分類の結節(23%)。
同様に、日本の陽性例のうち、6人(35%)には充実性結節があり、6人(35%)には部分充実性結節があり、5人(29%)には非充実性結節があった。がん陰性症例の中で、以前の症例の割合ががん症例の割合と一致するように、さまざまなサイズの小結節の数も選択されました。
研究の最初のステップは、追加のトレーニング データとアーキテクチャを使用して、以前に開発された機械学習モデルを改良することでした。
肺がん補助スクリーニング システムは、相互に連携する 13 のモデルで構成され、最初に肺をセグメント化し、全体的な評価を取得し、3 つの疑わしい領域を特定します。この情報は、各領域に疑わしい評価を割り当てるために使用されます。このシステムは、Google Cloud にデプロイされた Google Kubernetes Engine (GKE) エンジンを使用して、イメージを取り込み、機械学習モデルを実行し、結果を提供します。
簡単に言うと、システムの出力は疑いの評価と ROI (関心領域) を提供し、医師はその領域のスコアリング ガイドラインに基づいて判断を下すことができます。
2 番目のステップでは、研究者らは 3 つのデータセット DS_CA、DS_US、DS_NLST を使用してモデルを開発およびトレーニングしました。
トレーニングセット:
* DS_CA はカナダの病院システムからのデータです。このデータセットは 2010 年から 2017 年までの診断用 CT 検査で構成され、最終分類モデルをトレーニングするために使用されます。
*DS_US 患者の非スクリーニング CT は追加のトレーニングに使用されました。
※DS_NLSTは26,722件の患者データで構成されており、患者レベルでランダムにセグメンテーションして得られたサブセットがAIシステムの開発に使用されました。
テストセット:
* 最初のテスト データ セットは、DS_NLST の合計ケースからランダムに分割された 15% です。
* 2 番目のテスト データセットは、米国イリノイ州の病院システムである DS_US からの CT 症例をスクリーニングし、5,055 人の患者から 1,1792 件の身元不明の症例を分離しました。
*3 番目のデータセット DS_JPN は日本の仙台厚生病院からのもので、2006 年から 2018 年に LDCT スクリーニングを受けた 301 人の患者で構成されています。
がんを早期に検出する AI システムの能力を向上させるために、この研究には、診断の最大 2 年前までのがん陽性症例cancer_in_2が含まれています。 Cancer_in_2 では、すべての陰性症例はがんの確定症例がないことを確認するために少なくとも 2 年間追跡調査され、陽性症例は 2 年以内に画像診断によって診断された症例でした。
この研究の主な目的は、医師のがんの疑いレベル (LoS) スコアを統合して、考えられるすべての数値閾値をスキャンすることによって感度と特異度を計算することでした。LoS の受信者動作特性曲線は、AUC の範囲外として導出され、計算されました。第 2 の目的は、医師によるローカル スコアリング システムの使用と、緊急度の 2 値化されたしきい値に基づいて計算された症例管理の決定しきい値の感度/特異性を調査することでした。
たとえば、「6 か月の追跡 CT」は「3 か月の追跡 CT」よりも緊急性が低いとみなされ、同様に「悪性腫瘍の疑い」よりも緊急性が低いと考えられます。同様に、この研究でもスコアリングシステムの応答とAIシステムの応答について同様の分析を実施し、ORH分析を使用してAUCの違いを比較しました。
結果において、p 値 < 0.05 は AUC の差の比較が統計的に有意であることを示し、p 値 < 0.0125 または < 0.01 はボンフェローニ補正後の統計的有意性をそれぞれ示します。
アメリカと日本での研究では、AI 支援により、支援なしの治療法と比較して、スコアリング システムや症例管理オプションに対するすべての医師の感度が向上します。その中で、アメリカと日本の症例に関する研究では、LoS と AUC の両方が 0.023 改善し、人工知能の支援によりすべての Lung-RADS スコアにおいてより高い感度と特異度が達成されたことが示されました。
AI 支援を使用した場合、すべてのケース管理カテゴリで感度と特異度のスコアが高くなりました。米国の症例と日本の症例のAI支援特異度はそれぞれ5.5%と6.7%増加した。ただし、陽性スクリーニングにおける生検推奨の特異性は 1.1% 減少しました。
この研究は、米国全国肺がんスクリーニング試験の患者集団の分析にも焦点を当てており、その結果、特異性が 3.41 TP3T によってもさらに向上していることが示されました。日本の事例の研究結果でも、人工知能の支援により、1件あたり平均14秒のスクリーニング時間を短縮でき、そして、それは医師の診断の信頼性を大幅に高めます。
補助的な局在化の観点から、AI システムは米国と日本の研究でそれぞれ 89% がん症例と 75% がん症例において最も懸念される結節をマークしましたが、他のケースでは AI は最も懸念される結節の一部を見逃す可能性があります。
たとえば、医師が症例に疑わしいフラグを立て、AI システムが陰性のフラグを立てたあるケースでは、さらなる比較により、少なくとも 2 年間の陰性追跡調査中に検出されなかったより小さな亜充実結節が特定され、がんと診断されました。 ; 放射線科医によるさらなる検査の結果、これらは低浸潤性腺癌であると認定されたようであり、さらなる観察が進行中です。
要するに、このシステムは、2 か国の PACS システムおよび患者集団の遡及的研究で有効性を実証しました。困難な肺がんスクリーニング症例の AI 支援読影により、不必要な経過観察の来院が減り、経過観察画像の過剰使用が減り、頻繁な肺生検が回避され、医療システムへの負担が軽減される可能性があります。
実際、Google は長年にわたって肺がんの研究を行ってきました。
早くも2019年5月7日、Googleは2019年の開発者会議で、自社が開発した人工知能技術が医師よりも1年早く肺がんを発見でき、患者の生存確率を高めることができると発表し、これらの技術を実用的な医療に応用することにも取り組むと発表した。肺がん患者の治療と予後を改善するソリューション。
2019 年の開発者カンファレンス終了からわずか 10 日余り後、Google AI 研究者のダニエル・ツェー氏は、スタンフォード大学、ニューヨーク大学、その他の機関の研究者と協力して、最新の深層学習モデルを Nature Medicine Tests 誌に発表し、AI プログラムの精度が高いことを示しました。人間の病気の状態を判断する能力は 94% に達し、この値はテストに参加した 6 人の放射線科医よりも優れており、これらの人間の医師は約 8 年の臨床経験がありました。
それ以来、Google の肺がんの研究は止まっていません。前述の機械学習モデルの継続的な開発に基づいて、Google は最終的に、複数の国、複数の専門家、複数の患者においてモデルの有効性をさらに検証しました。そしてこれは、肺がん分野における人工知能の実用化も加速し、近い将来真に人類に恩恵をもたらすことを意味しているのかもしれない。