2ヶ月前
進行中の正規化自己注意ネットワークを用いたビデオポリープ分割
Ge-Peng Ji; Yu-Cheng Chou; Deng-Ping Fan; Geng Chen; Huazhu Fu; Debesh Jha; Ling Shao

要約
既存のビデオポリプセグメンテーション(VPS)モデルは、一般的に畳み込みニューラルネットワーク(CNNs)を使用して特徴を抽出します。しかし、受容野が限られているため、CNNsは連続するビデオフレーム内の全般的な時間的および空間的情報を十分に活用できず、偽陽性のセグメンテーション結果を生むことがあります。本論文では、新しいPNS-Net(Progressively Normalized Self-attention Network)を提案します。このネットワークは単一のRTX 2080 GPU上でリアルタイム速度(約140fps)で効率的にポリプビデオから表現を学習し、後処理なしで動作します。提案したPNS-Netは、基本的な正規化自己注意ブロックのみに基づいて構築され、再帰とCNNを完全に組み込んでいます。挑戦的なVPSデータセットでの実験により、提案したPNS-Netが最先端の性能を達成することが示されました。また、チャンネル分割、ソフトアテンション、進行学習戦略の有効性について広範な実験を行いました。その結果、異なる設定下でもPNS-Netが良好に動作することを確認し、VPSタスクに対する有望な解決策であることが明らかになりました。