17日前

EMCAD:医療画像セグメンテーションのための効率的マルチスケール畳み込み注意機構デコーディング

Md Mostafijur Rahman, Mustafa Munir, Radu Marculescu
EMCAD:医療画像セグメンテーションのための効率的マルチスケール畳み込み注意機構デコーディング
要約

医療画像セグメンテーションにおいて、特に計算リソースが限られた環境では、効率的かつ効果的なデコーディング機構が極めて重要である。しかし、従来のデコーディング機構はしばしば高い計算コストを伴う。この課題に対応するため、本研究では、性能と計算効率の両面を最適化する新たな効率的マルチスケール畳み込み注意機構デコーダー「EMCAD」を提案する。EMCADは、特徴マップの表現力をマルチスケール畳み込みにより顕著に向上させる独自のマルチスケールディープワイズ畳み込みブロックを採用している。さらに、チャネル、空間、およびグループ化(大カーネル)ゲート付き注意機構を組み合わせることで、複雑な空間的関係を効果的に捉えつつ、顕著な領域に焦点を当てることが可能となる。グループ化およびディープワイズ畳み込みの導入により、EMCADは非常に計算効率が高く、スケーラビリティにも優れており(標準的なエンコーダーを用いた場合、パラメータ数はわずか191万、FLOPsは0.381Gに収束)、実用性を確保している。6種類の医療画像セグメンテーションタスクに属する12のデータセットに対する厳密な評価において、EMCADは最先端(SOTA)の性能を達成し、パラメータ数とFLOPsをそれぞれ79.4%、80.3%削減した。さらに、異なるエンコーダーへの適応性および複数のセグメンテーションタスクにおける汎用性から、EMCADは今後の医療画像解析における効率的かつ高精度な分析を推進する有望なツールであることが示された。本研究の実装コードは、https://github.com/SLDGroup/EMCAD にて公開されている。