2ヶ月前

UGCANet: 内視鏡画像分析用の統一されたグローバルコンテクスト認識型トランスフォーマーに基づく特徴量アライメントネットワーク

Pham Vu Hung; Nguyen Duy Manh; Nguyen Thi Oanh; Nguyen Thi Thuy; Dinh Viet Sang
UGCANet: 内視鏡画像分析用の統一されたグローバルコンテクスト認識型トランスフォーマーに基づく特徴量アライメントネットワーク
要約

胃腸内視鏡検査は、カメラやその他の機器が装備された柔軟なチューブを使用して消化管を検査する医療手順です。この低侵襲技術は、炎症性腸疾患、消化管出血、大腸がんなどのさまざまな胃腸疾患の診断と管理に利用されます。上部消化管における病変の早期発見と同定、ならびにがん発症のリスクがある悪性ポリープの同定は、胃腸内視鏡検査の診断および治療応用において重要な要素です。したがって、胃腸疾患の検出率を向上させることで、患者の予後を大幅に改善し、適時に医療介入を行う可能性を高めることができます。これは患者の寿命を延ばし、全体的な健康状態を改善する可能性があります。本論文では、複数のタスクを同時に実行できる新しいTransformerベースの深層ニューラルネットワークを提案します。このアプローチでは、独自のグローバルコンテキスト認識モジュール(global context-aware module)を導入し、強力なMiTバックボーンと特徴量アライメントブロック(feature alignment block)を利用することで、ネットワークの表現能力を向上させます。この新設計により、さまざまな内視鏡診断タスクにおいて性能が大幅に向上しています。広範な実験結果から、当方法が他の最先端手法よりも優れた性能であることが示されています。