11日前

肺の健康におけるAI:複数のCTスキャンデータセットを用いた検出および診断モデルのベンチマーク

Tushar, Fakrul Islam, Wang, Avivah, Dahal, Lavsen, Harowicz, Michael R., Lafata, Kyle J., Tailor, Tina D., Lo, Joseph Y.
肺の健康におけるAI:複数のCTスキャンデータセットを用いた検出および診断モデルのベンチマーク
要約

肺がんは世界中でがん死の主要原因であり、低線量CT(LDCT)を用いた早期発見が死亡率の低減に著しい可能性を示している。医療画像分野における人工知能(AI)の統合が進む中、強固なAIモデルの開発と評価には、大規模かつ正確にアノテーションされたデータセットへのアクセスが不可欠である。本研究では、2,000例を超えるスキャンおよび3,000個以上の専門家検証済み結節を含む、世界最大級のオープンアクセスLDCTデータセットであるDuke Lung Cancer Screening(DLCS)データセットの有用性を提示する。本研究では、LUNA16、LUNA25、NLST-3D+を含む内部および外部データセットを用いて、3D結節検出および肺がん分類のための深層学習モデルをベンチマーク化した。結節検出のため、MONAIベースのRetinaNetモデル2種(DLCSDmDおよびLUNA16-mD)を構築し、コンペティション性能指標(CPM)を用いて評価した。分類のためには、最先端の事前学習モデル(Models Genesis、Med3D)、自己教師学習型の基礎モデル(FMCB)、ランダム初期化されたResNet50、および本研究で提案する新たな戦略的ウォームスタート++(SWS++)モデルの5モデルを比較した。SWS++モデルは、同一の検出パイプライン内で選別された候補パッチを用いて分類バックボーンを事前学習することで、タスクに特化した特徴学習を可能にする。本研究で開発したモデルは、複数のデータセットにおいて優れた汎化性能を示し、SWS++モデルは複数のデータセットで既存の基礎モデルと同等または優れた性能(AUC:0.71~0.90)を達成した。本研究で開発したすべてのコード、モデル、データは公開され、再現性および共同研究を促進する。本研究は、肺がんAI研究の標準化されたベンチマークリソースを確立し、今後のモデル開発、検証、臨床応用への支援を可能にする。

肺の健康におけるAI:複数のCTスキャンデータセットを用いた検出および診断モデルのベンチマーク | 最新論文 | HyperAI超神経