17日前
DCSAU-Net:医療画像セグメンテーションのためのより深く、よりコンパクトなスプリットアテンションU-Net
Qing Xu, Zhicheng Ma, Na HE, Wenting Duan

要約
深層学習アーキテクチャである畳み込みニューラルネットワーク(CNN)は、コンピュータビジョン分野において優れた成果を上げている。特に、CNNで構成されたエンコーダ・デコーダ型アーキテクチャであるU-Netは、バイオメディカル画像のセグメンテーション分野で画期的な進展を遂げ、幅広い実用的応用が行われている。しかし、エンコーダ部における各ダウンサンプリング層の均一な設計と、単純に積み重ねられた畳み込み層の構成では、異なる深さにおける特徴量から十分な情報を抽出することができない。医療画像の複雑さが増すにつれ、従来の手法に新たな課題が生じている。本論文では、より深い構造かつコンパクトなスプリットアテンションU字型ネットワーク(DCSAU-Net)を提案する。このモデルは、新たな2つのフレームワーク——「プライマリ特徴量保存機構」と「コンパクトスプリットアテンションブロック」——を活用し、低レベルと高レベルの意味的情報を効率的に活用する。本モデルは、CVC-ClinicDB、2018 Data Science Bowl、ISIC-2018、SegPC-2021の4つのデータセット上で評価された結果、平均交差率(mIoU)およびF1スコアにおいて、他の最先端(SOTA)手法を上回る性能を示した。特に顕著な点は、困難な画像に対しても優れたセグメンテーション性能を発揮した点である。本研究のコードおよび詳細な技術情報は、https://github.com/xq141839/DCSAU-Net にて公開されている。