HyperAIHyperAI

Command Palette

Search for a command to run...

Polyp-PVT:ピラミッドビジョン変換器を用いたポリープセグメンテーション

Bo Dong Wenhai Wang Deng-Ping Fan Jinpeng Li Huazhu Fu Ling Shao

概要

多数のポリープセグメンテーション手法は、CNNをバックボーンとして用いるため、エンコーダーとデコーダー間での情報交換において、以下の2つの重要な課題が生じる。1)異なるレベルの特徴量間における寄与度の差異を考慮すること、2)これらの特徴量を効果的に統合するメカニズムを設計することである。従来のCNNベースの手法とは異なり、本研究ではより強力かつ頑健な表現を学習可能なトランスフォーマー・エンコーダーを採用した。さらに、ポリープの画像取得時の影響やその特徴の曖昧さを考慮し、カスケード融合モジュール(CFM)、カモフラージュ識別モジュール(CIM)、類似性集約モジュール(SAM)の3つの標準モジュールを導入した。これらのモジュールのうち、CFMは高レベル特徴からポリープの意味的および位置情報を取り込むために用いられ、CIMは低レベル特徴に隠されたポリープ情報を捉えるために活用される。一方、SAMは高レベルの意味的・位置情報に基づいてポリープ領域のピクセル特徴を全体に拡張し、階層間特徴の効果的な統合を実現する。提案するモデル「Polyp-PVT」は、特徴量内のノイズを効果的に抑制し、表現能力を著しく向上させた。5つの広く採用されているデータセットを用いた大規模な実験により、本モデルが従来の代表的手法に比べ、外観の変化、小型対象、回転などのさまざまな困難な状況に対してより高いロバスト性を示すことが確認された。本モデルの実装コードは、https://github.com/DengPingFan/Polyp-PVT にて公開されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています