HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA が 3D 医療画像生成フレームワークをオープンソース化

高品質な 3D 医用画像データは現代の放射線科向け AI の基盤であるが、データのプライバシー、注釈コスト、サンプル規模に制約され、医療用 AI モデルの訓練には長らく「データボトルネック」が存在していた。この課題を解決するため、NVIDIA は先日、高解像度 3D CT および MRI データの合成をサポートするオープンソースフレームワーク「NV-Generate-CTMR」を発表し、研究者らが医用画像 AI システムをより効率的に構築できるように支援している。 本フレームワークは、NVIDIA が以前発表した MAISi(Medical AI for Synthetic Imaging)アーキテクチャに基づいて開発されており、最新バージョンの MAISi-v2 では Latent Rectified Flow 技術を採用することで、従来の拡散モデルと比較して推論速度を約 33 倍向上させると同時に、生成品質も改善した。同フレームワークでは完全な 3D 医用ボリュームデータを生成可能であり、対応する解剖学的構造セグメンテーション結果も出力できるため、データ拡張や異種モダリティ間生成、腫瘍セグメントなどのタスクに適応している。 併せて NVIDIA は脳 MRI 専用生成モデル「NV-Generate-MR-Brain」も公開した。該モデルは世界最大のオープンソースマルチモーダル MRI データセット「MR-RATE」を用いた学習により作成されたもので、同データセットには 8.3 万人を超える患者から得られた約 70 万件の MRI ボリュームデータが含まれ、匿名化された放射線科レポートおよび DICOM メタデータが付帯している。モデルは T1、T2、FLAIR、SWI など複数の脳 MRI セQUENCE を生成でき、最高で 512×512×256 の解像度を有する完全な頭部画像を作成することが可能だ。 従来型の医用画像生成手法と比べ、NV-Generate-CTMR の重要な特徴の一つとして、ボクセルサイズの変更可能性、異なるボリュームサイズのサポート、そして全身範囲での生成が可能であることを挙げられる。これにより多種類の臨床スキャンプロトコルへの適応ができ、臓器ごとにモデル再トレーニングを行う必要はない。NVIDIA はこれを「医用画像ファウンデーションモデル」と位置付けている。 現在、本プロジェクトは完全にオープンソース化されており、事前学習済み重み値、訓練設定、推論コードを含んでいるため、研究者らはローカル GPU で直接実行したり微調整を行ったりできるという。NVIDIA は、合成医用画像は今後、プライバシー保護下でのデータ共有、稀病変のシミュレーション、医療 AI の汎化能力向上といった分野において、ますます重要な役割を果たしていくと述べている。

関連リンク