16日前

医療画像セグメンテーションにおけるカスケード型アテンションデコード

{Radu Marculescu, Md Mostafijur Rahman}
医療画像セグメンテーションにおけるカスケード型アテンションデコード
要約

トランスフォーマーは、自己注意(self-attention)機構を用いて長距離依存関係を捉える能力により、医療画像セグメンテーションにおいて大きな可能性を示している。しかし、画素間の局所的(文脈的)関係を学習する能力に欠けているという課題がある。従来の手法では、トランスフォーマーのエンコーダまたはデコーダモジュールに畳み込み層を組み込むことでこの問題を克服しようとしているが、その結果、特徴量の不整合が生じる場合もあった。本研究では、この問題に対処するため、階層的ビジョントランスフォーマーのマルチスケール特徴を活用する新たなアテンションベースのデコーダ、すなわち「CASCaded Attention DEcoder(CASCADE)」を提案する。CASCADEは、i)スキップ接続を用いた特徴の融合を行うアテンションゲート、およびii)背景情報を抑制することで長距離および局所的文脈情報を強化する畳み込みアテンションモジュールから構成される。さらに、収束速度が速く、性能も優れるため、マルチステージの特徴量および損失集約フレームワークを採用している。実験の結果、CASCADEを搭載したトランスフォーマーは、最先端のCNNおよびトランスフォーマーベースのアプローチを顕著に上回り、DICEスコアで最大5.07%、mIoUスコアで最大6.16%の向上を達成した。本研究で提案するCASCADEは、より優れたアテンションベースのデコーダ設計に向けた新たな道を開くものである。