17日前

UNeXt:MLPを基盤とする高速医療画像セグメンテーションネットワーク

Jeya Maria Jose Valanarasu, Vishal M. Patel
UNeXt:MLPを基盤とする高速医療画像セグメンテーションネットワーク
要約

近年、UNetおよびその最新の拡張手法であるTransUNetは、医療画像セグメンテーション分野で主流となる手法となっている。しかし、これらのネットワークはパラメータ数が多く、計算負荷が高く、処理が遅いため、ポイント・オブ・ケア(診療現場)での迅速な画像セグメンテーションに効果的に活用するには不向きである。このような課題に対応して、本研究では、畳み込み型マルチレイヤーパーセプトロン(MLP)に基づく画像セグメンテーション用ネットワーク「UNeXt」を提案する。UNeXtは、初期の畳み込み段階と、潜在空間(latent stage)におけるMLP段階を有効に組み合わせた構造として設計されている。特に、畳み込み特徴量を効率的にトークン化・投影する「トークナイズドMLPブロック」を導入し、MLPを用いて表現をモデル化する。さらに性能向上を図るため、MLPへの入力においてチャネルのシフト(channel shifting)を導入することで、局所的な依存関係の学習に焦点を当てる。潜在空間内でのトークナイズドMLPの採用により、パラメータ数と計算複雑性を大幅に削減しつつ、より優れた表現力を得ることでセグメンテーション性能の向上が可能となる。また、エンコーダとデコーダの複数レベル間におけるスキップ接続を備えている。複数の医療画像セグメンテーションデータセット上でUNeXtを評価した結果、最先端の医療画像セグメンテーションアーキテクチャと比較して、パラメータ数を72倍削減、計算複雑性を68倍低減、推論速度を10倍向上させながら、さらに優れたセグメンテーション性能を達成した。実装コードは、https://github.com/jeya-maria-jose/UNeXt-pytorch にて公開されている。

UNeXt:MLPを基盤とする高速医療画像セグメンテーションネットワーク | 最新論文 | HyperAI超神経