
要約
畳み込みニューラルネットワーク(CNN)およびトランスフォーマーは、バイオメディカル画像セグメンテーションにおいて最も広く用いられているアーキテクチャであるが、それぞれ固有の局所性や計算複雑性の制約により、長距離依存関係を効果的に扱う能力に限界がある。この課題に対処するため、本研究ではバイオメディカル画像セグメンテーション向けの汎用ネットワーク「U-Mamba」を提案する。最近注目を集めている状態空間系列モデル(SSMs)—長系列処理において優れた性能を発揮する新世代の深層系列モデル—に着想を得て、畳み込み層の局所的特徴抽出能力とSSMの長距離依存関係の捉え方を統合したハイブリッドCNN-SSMブロックを設計した。さらに、U-Mambaは自己設定機構を備えており、手動による調整なしにさまざまなデータセットに自動的に適応可能である。本研究では、CTおよびMRI画像における3次元腹部臓器セグメンテーション、内視鏡画像における手術器具セグメンテーション、顕微鏡画像における細胞セグメンテーションという4つの多様なタスクにおいて、広範な実験を実施した。実験結果から、U-Mambaはすべてのタスクにおいて最先端のCNNベースおよびトランスフォーマーベースのセグメンテーションネットワークを上回る性能を発揮した。これにより、バイオメディカル画像解析における効率的な長距離依存関係モデリングの新たな道が開かれた。コード、モデル、データはすべて公開されており、https://wanglab.ai/u-mamba.html にて入手可能である。