17日前

マスク付きクロス画像符号化による少サンプルセグメンテーション

Wenbo Xu, Huaxi Huang, Ming Cheng, Litao Yu, Qiang Wu, Jian Zhang
マスク付きクロス画像符号化による少サンプルセグメンテーション
要約

少数回サンプリングセグメンテーション(Few-shot Segmentation; FSS)は、限られた数のアノテーション付き画像を用いて、未観測クラスの画素単位ラベルを推定する密な予測タスクである。FSSの主な課題は、少数のラベル付きサポート例から学習したクラスプロトタイプを用いて、クエリ画素のラベルを分類することにある。従来のFSSアプローチは、サポート画像から個別にクラス固有の記述子を学習する傾向にあり、これによりサポート画像とクエリ画像間の豊かな文脈情報および相互依存関係が無視されるという問題があった。この制約を克服するため、本研究では、物体の詳細を記述する共通の視覚的性質を捉え、双方向の画像間依存関係を学習することで特徴間の相互作用を強化するための統合学習手法、すなわち「マスク付きクロス画像符号化(Masked Cross-Image Encoding; MCE)」を提案する。MCEは視覚的表現の拡張モジュールにとどまらず、画像間の相互依存関係と暗黙的なガイドラインも考慮している。PASCAL-$5^i$およびCOCO-$20^i$というFSSベンチマーク上での実験により、提案手法が優れたメタラーニング能力を有していることが示された。

マスク付きクロス画像符号化による少サンプルセグメンテーション | 最新論文 | HyperAI超神経