17日前
RaBiT:逆 Attention を用いた双向特徴ピラミッドネットワークを活用した効率的な Transformer による大腸ポリープセグメンテーション
Nguyen Hoang Thuan, Nguyen Thi Oanh, Nguyen Thi Thuy, Stuart Perry, Dinh Viet Sang

要約
大腸ポリープの自動かつ正確なセグメンテーションは、大腸がんの早期診断に不可欠である。近年、高度なディープラーニングモデルはポリープセグメンテーションにおいて有望な結果を示している。しかし、これらモデルは多スケール特徴の表現能力および汎化性能において依然として課題を抱えている。本研究では、これらの問題に対処するため、エンコーダに軽量なTransformerベースのアーキテクチャを導入し、複数レベルのグローバルな意味的関係をモデル化する「RaBiT」と呼ばれるエンコーダ・デコーダ型モデルを提案する。デコーダは、逆方向アテンションモジュールを備えた複数の双方向特徴ピラミッド層から構成されており、異なるレベルの特徴マップをより効果的に統合し、ポリープ境界を段階的に精緻化する。また、逆方向アテンションモジュールを軽量化するための新たなアイデアを提示し、多クラスセグメンテーションに適した構造として改良している。複数のベンチマークデータセットを用いた広範な実験の結果、本手法はすべてのデータセットにおいて既存手法を上回る性能を達成しつつ、低計算量を維持している。さらに、トレーニングデータとテストデータの特性が異なる場合でも、クロスデータセット実験において高い汎化能力を示しており、実用性の高さが確認された。