17日前

意味相関を促進する形状可変コンテキストによるセグメンテーション

Henghui Ding, Xudong Jiang, Bing Shuai, Ai Qun Liu, Gang Wang
意味相関を促進する形状可変コンテキストによるセグメンテーション
要約

文脈は意味的セグメンテーションにおいて不可欠である。物体の形状が多様であり、シーン画像内の配置も複雑であるため、異なる物体に対する文脈の空間的スケールや形状には大きなばらつきが生じる。したがって、事前に定義された固定領域から多様な文脈情報を集約することは、効果的または効率的ではない。本研究では、各画素に対してスケールおよび形状が変化する意味的マスクを生成し、その画素の文脈領域を制限する手法を提案する。これにより、まず、ペア間の意味的相関を推定するための新規なペア畳み込み(paired convolution)を提案し、その相関に基づいて形状マスクを生成する。得られた文脈領域の推定空間範囲を用いて、入力の外観に応じて変化する形状マスクによって受容領域を制御する形状可変畳み込み(shape-variant convolution)を設計する。これにより、従来の固定領域ではなく、画素と意味的に相関する領域から文脈情報を集約するネットワークを実現する。さらに、低レベル特徴のノイズによる誤予測を低減するため、ラベルノイズ除去モデルも提案する。本手法は、追加の複雑な構造やテクニックを用いずに、6つの公開セグメンテーションデータセットにおいて一貫して新たなSOTA(最先端性能)を達成した。