2ヶ月前

FSS-1000: 少ショットセグメンテーション用の1000クラスデータセット

Xiang Li; Tianhan Wei; Yau Pun Chen; Yu-Wing Tai; Chi-Keung Tang
FSS-1000: 少ショットセグメンテーション用の1000クラスデータセット
要約

過去数年間、PASCAL VOC、ImageNet、COCOなどの大規模な人間によるアノテーションデータセットの利用により、深層学習が画像認識で成功を収めています。これらのデータセットは多くの物体カテゴリをカバーしていますが、まだ多数の物体が含まれていない状況があります。大量の人間によるアノテーションなしで同じタスクを達成できるでしょうか?本論文では、5つのみのアノテーション付き訓練サンプルしか利用できない少ショットオブジェクトセグメンテーションに焦点を当てています。当方針の性能評価と検証のために、1000クラスの物体を含むピクセル単位での真値セグメンテーションアノテーションを持つ少ショットセグメンテーションデータセットFSS-1000を構築しました。FSS-1000の特徴は、これまでのデータセットで見られなかったか、またはアノテーションされていなかった多数の物体(小さな日常用品、商品、アニメキャラクター、ロゴなど)が含まれていることです。基準モデルはVGG-16、ResNet-101、Inceptionなどの標準的なバックボーンネットワークを使用して構築しました。驚くことに、FSS-1000からスクラッチでモデルを学習させた場合、ImageNet(FSS-1000よりも100倍以上の大きさ)で事前学習された重みを使用するよりも同等またはそれ以上の結果を得ることができました。当方針とデータセットはシンプルかつ効果的であり、非常に少ないアノテーション付き訓練サンプルから新しい物体クラスのセグメンテーションを学習する際に容易に拡張可能です。データセットはhttps://github.com/HKUSTCV/FSS-1000 から入手できます。