17日前

Polyp-PVT:ピラミッドビジョン変換器を用いたポリープセグメンテーション

Bo Dong, Wenhai Wang, Deng-Ping Fan, Jinpeng Li, Huazhu Fu, Ling Shao
Polyp-PVT:ピラミッドビジョン変換器を用いたポリープセグメンテーション
要約

多数のポリープセグメンテーション手法は、CNNをバックボーンとして用いるため、エンコーダーとデコーダー間での情報交換において、以下の2つの重要な課題が生じる。1)異なるレベルの特徴量間における寄与度の差異を考慮すること、2)これらの特徴量を効果的に統合するメカニズムを設計することである。従来のCNNベースの手法とは異なり、本研究ではより強力かつ頑健な表現を学習可能なトランスフォーマー・エンコーダーを採用した。さらに、ポリープの画像取得時の影響やその特徴の曖昧さを考慮し、カスケード融合モジュール(CFM)、カモフラージュ識別モジュール(CIM)、類似性集約モジュール(SAM)の3つの標準モジュールを導入した。これらのモジュールのうち、CFMは高レベル特徴からポリープの意味的および位置情報を取り込むために用いられ、CIMは低レベル特徴に隠されたポリープ情報を捉えるために活用される。一方、SAMは高レベルの意味的・位置情報に基づいてポリープ領域のピクセル特徴を全体に拡張し、階層間特徴の効果的な統合を実現する。提案するモデル「Polyp-PVT」は、特徴量内のノイズを効果的に抑制し、表現能力を著しく向上させた。5つの広く採用されているデータセットを用いた大規模な実験により、本モデルが従来の代表的手法に比べ、外観の変化、小型対象、回転などのさまざまな困難な状況に対してより高いロバスト性を示すことが確認された。本モデルの実装コードは、https://github.com/DengPingFan/Polyp-PVT にて公開されている。

Polyp-PVT:ピラミッドビジョン変換器を用いたポリープセグメンテーション | 最新論文 | HyperAI超神経