16日前

注目ベースのマルチコンテキスト誘導による少サンプルセマンティックセグメンテーション

{Gang Yu, Pengwan Yang, Tao Hu, Chiliang Zhang, Yadong Mu, Cees G. M. Snoek}
要約

少サンプル学習(few-shot learning)は、従来の深層学習手法が膨大なデータ量を必要とするという事実に由来する、まだ発展途上の研究分野である。特にセマンティックセグメンテーションにおいては、ピクセル単位のラベル付けが非常に手間のかかる作業であるため、ラベル付きデータの不足はより深刻な課題となる。この問題に対処するため、本研究では「Attentionベースのマルチコンテキストガイド(A-MCG)ネットワーク」を提案する。このネットワークは、サポートブランチ、クエリブランチ、特徴融合ブランチの3つのブランチから構成されている。A-MCGの特徴的な点は、サポートブランチとクエリブランチ間におけるマルチスケールコンテキスト特徴の統合であり、これによりサポートセットからのより優れたガイドラインを実現している。さらに、融合ブランチでは空間的アテンションを導入し、複数スケールからのコンテキスト情報を強調することで、ワンショット学習における自己教師学習の効果を向上させている。マルチショット学習における特徴融合問題に対処するため、Conv-LSTMを用いて逐次的なサポート特徴を協調的に統合し、最終的な精度を向上させている。本アーキテクチャは、PASCAL VOC12データセットの変種において未見クラスで最先端の性能を達成し、ワンショットおよびファイブショット設定において、mIoUでそれぞれ1.1%、1.4%の顕著な向上を示し、従来手法を上回る結果を示している。

注目ベースのマルチコンテキスト誘導による少サンプルセマンティックセグメンテーション | 最新論文 | HyperAI超神経