17日前

マルチスケールアテンションにおけるマルチ周波数を用いたモダリティに依存しないドメイン汎用医療画像セグメンテーション

Ju-Hyeon Nam, Nur Suriza Syazwany, Su Jung Kim, Sang-Chul Lee
マルチスケールアテンションにおけるマルチ周波数を用いたモダリティに依存しないドメイン汎用医療画像セグメンテーション
要約

深層ニューラルネットワークにおける一般化性能は、医療画像セグメンテーションにおいて極めて重要な役割を果たす。しかし、従来の深層学習ベースの医療画像解析手法は、モダリティに依存しない(モダリティアグノスティックな)かつドメイン一般化可能なモデルを実現する上で不可欠な周波数分散(frequency variance)の重要性を軽視しがちである。さらに、深層監視(deep supervision)を用いたマルチタスク学習において、情報損失が生じる可能性を考慮していない多数のモデルが存在し、これがモデルの表現能力を低下させる要因となる。これらの課題に対処するため、本研究では、医療画像セグメンテーションを対象としたモダリティアグノスティックでドメイン一般化可能なネットワーク(Modality-agnostic Domain Generalizable Network; MADGNet)を提案する。MADGNetは、二つの主要な構成要素からなる:多スケール多周波数注意機構(Multi-Frequency in Multi-Scale Attention; MFMSA)ブロックと、アンサンブル部分復号モジュール(Ensemble Sub-Decoding Module; E-SDM)。MFMSAブロックは、多周波数および多スケール特徴を統合することで、空間特徴抽出プロセス、特に境界特徴の捉え方を精緻化し、組織の輪郭や解剖学的構造を明示的に示す有用な手がかりを提供する。また、E-SDMは、特に低解像度からの大規模なアップサンプリングに伴う情報損失を軽減することを目的として設計されており、深層監視を伴うマルチタスク学習における表現力の維持を図る。MADGNetのセグメンテーション性能は、6種類のモダリティおよび15のデータセットを用いて評価された。広範な実験により、MADGNetがさまざまなモダリティにおいて、最先端モデルを常に上回る性能を示すことを実証した。これは、MADGNetが多様な画像取得環境において優れた性能を発揮する、堅牢な医療画像セグメンテーションソリューションであることを裏付けている。本研究のMADGNetのコードはGitHubリンクから公開されている。