2ヶ月前
TGANet: テキストガイダンスによる注意の改善を用いたポリープ分割
Nikhil Kumar Tomar; Debesh Jha; Ulas Bagci; Sharib Ali

要約
大腸内視鏡検査は金標準の手順ですが、操作者に大きく依存しています。自動ポリープセグメンテーションは、前がん病変を検出することで、早期の大腸がんを見逃す確率を最小限に抑え、早期治療を可能にすることができます。このタスクのために開発された深層学習手法があるにもかかわらず、ポリープのサイズのばらつきがモデルの学習に影響を与え、訓練データセットの大多数のサンプルのサイズ属性に限定されてしまうため、異なるサイズのポリープに対して最適でない結果をもたらす可能性があります。本研究では、訓練中にテキストアテンションの形式でサイズ関連およびポリープ数関連の特徴を利用します。補助的な分類タスクを導入し、テキストベースの埋め込みに重み付けを行うことで、ネットワークが異なるサイズのポリープに対応できる追加の特徴表現を学習できるようにしました。これにより、複数のポリープが存在する場合にも適応できます。実験結果は、これらの追加されたテキスト埋め込みが最先端のセグメンテーション手法と比較してモデル全体の性能を向上させることを示しています。4つの異なるデータセットについて探り、サイズごとの改善点について考察を提供します。提案するテキストガイデッドアテンションネットワーク(TGANet)は、異なるデータセットにおける可変サイズのポリープに対して良好な汎化性能を持つことが確認されました。