12日前
領域ベースのワンショットセマンティックセグメンテーションのための接続アテンションを備えたピラミッドグラフネットワーク
{ Rui Yao, Qingyao Wu, Jiushuang Guo, Fayao Liu, Guosheng Lin, Chi Zhang}

要約
ワンショット画像セグメンテーションは、新たなクラスのセグメンテーションタスクを、たった1枚のトレーニング画像のみを用いて行うことを目的とする。この課題の難しさは、画像セグメンテーションが構造化されたデータ表現を持つことにある。その結果、多くのデータ要素間で複数対複数のメッセージ伝達問題が生じる。従来の手法は、サポートデータをグローバルな記述子に圧縮することで、この問題を一対多の問題に簡略化してきた。しかし、混合されたグローバル表現は個々の要素のデータ構造や情報を失ってしまう。本研究では、構造化されたセグメンテーションデータをグラフでモデル化し、アテンション付きグラフ推論を用いて、サポートデータからクエリデータへラベル情報を伝達する手法を提案する。グラフアテンション機構は、接続されたグラフノード間のアテンション重みを学習することで、構造化されたデータ間における要素対要素の対応関係を確立する。さらに、異なる意味論的レベルでの対応関係を捉えるために、画像領域の異なるサイズをグラフノードとしてモデル化するピラミッド型構造を導入し、各レベルでグラフ推論を実施する。PASCAL VOC 2012データセットにおける実験結果から、提案手法がベースライン手法を大きく上回り、1ショットおよび5ショットセグメンテーションベンチマークにおいて、新たな最先端の性能を達成することが示された。