3ヶ月前

ColonFormer:コロンポリープセグメンテーションのための効率的なTransformerベースの手法

Nguyen Thanh Duc, Nguyen Thi Oanh, Nguyen Thi Thuy, Tran Minh Triet, Dinh Viet Sang
ColonFormer:コロンポリープセグメンテーションのための効率的なTransformerベースの手法
要約

内視鏡画像の自動解析においてポリープの同定は、コンピュータ支援臨床支援システムにおいて困難な課題である。畳み込みニューラルネットワーク(CNN)、トランスフォーマー、およびそれらの組み合わせに基づくモデルが、ポリープのセグメンテーションにおいて有望な結果を示すとともに提案されている。しかし、これらの手法には、ポリープの局所的な外観のみをモデル化するという制約や、復号プロセスにおける空間的依存性を捉えるための多レベル特徴の不足といった限界がある。本論文では、こうした課題を克服するため、新たなネットワーク「ColonFormer」を提案する。ColonFormerは、エンコーダとデコーダの両側で長距離の意味的情報をモデル化できるエンコーダ・デコーダ構造を採用している。エンコーダは、マルチスケールでのグローバルな意味的関係を効率的に捉えるために、軽量なトランスフォーマーに基づくアーキテクチャである。デコーダは、多レベルの特徴を学習することで特徴表現を豊かにするために階層的なネットワーク構造を設計している。さらに、グローバルマップにおけるポリープオブジェクトの境界を精緻化するため、新しいスカイプ接続技術を用いたリファインメントモジュールを追加している。本研究では、Kvasir、CVC-Clinic DB、CVC-ColonDB、CVC-T、ETIS-Laribの5つの代表的なベンチマークデータセットを用いて広範な実験を実施した。実験結果から、提案手法のColonFormerは、すべてのベンチマークデータセットにおいて、他の最先端手法を上回る性能を発揮することが明らかになった。