2ヶ月前
WeakPolyp: あなたはポリープセグメンテーションのためにバウンディングボックスだけを見る
Jun Wei; Yiwen Hu; Shuguang Cui; S.Kevin Zhou; Zhen Li

要約
高価なピクセルレベルのラベルに制約されるため、ポリープ分割モデルはデータ不足に悩まされ、汎化性能が低下しています。一方、ポリープのバウンディングボックス注釈ははるかに安価で入手しやすいです。したがって、ラベリングコストを削減するために、バウンディングボックス注釈のみに基づいて弱教師ありのポリープ分割モデル(すなわち、WeakPolyp)を学習することを提案します。しかし、粗いバウンディングボックスには多くのノイズが含まれています。この干渉を避けるために、マスク・トゥ・ボックス(Mask-to-Box, M2B)変換を導入しました。予測の外側のボックスマスクを直接監督する代わりに、M2Bは予測自体を監督することで、粗いラベルと精密な予測との間の不一致を大幅に軽減します。ただし、M2Bは疎な監督しか提供しないため、予測の一意性が保てません。そこで、さらにスケール一貫性(Scale Consistency, SC)損失を提案します。同じ画像内の異なるスケールでの予測を明示的に合わせることで、SC損失は予測の変動を大きく減少させます。当社のWeakPolypはプラグアンドプレイ型モデルであり、他の魅力的なバックボーンへ簡単に移植できます。また、提案されたモジュールは訓練中にのみ使用され、推論時には計算コストがかかりません。広範囲にわたる実験により、当社が提案するWeakPolypの有効性が示されており、驚くことに完全教師ありモデルと同等の性能を達成しており、マスク注釈なしでも機能します。注:「プラグアンドプレイ型」は「plug-and-play」の一般的な日本語訳です。「推論」は「inference」に対応する日本語表現です。