1ヶ月前

iSAID: 大規模な空中画像のインスタンスセグメンテーション用データセット

Syed Waqas Zamir; Aditya Arora; Akshita Gupta; Salman Khan; Guolei Sun; Fahad Shahbaz Khan; Fan Zhu; Ling Shao; Gui-Song Xia; Xiang Bai
iSAID: 大規模な空中画像のインスタンスセグメンテーション用データセット
要約

既存のEarth Visionデータセットは、語義分割または物体検出に適しています。本研究では、空中画像におけるインスタンス分割のための初のベンチマークデータセットを紹介します。このデータセットは、インスタンスレベルの物体検出とピクセルレベルのセグメンテーションタスクを組み合わせています。自然環境でのインスタンス分割と比較して、空中画像には一意の課題が存在します。例えば、一枚の画像あたり非常に多くのインスタンス数、大きなオブジェクトサイズ変動、および多数の小さなオブジェクトなどがあります。我々の大規模で密集注釈された空中画像インスタンス分割データセット(iSAID)は、2,806枚の高解像度画像にわたる15カテゴリ合計655,451個の物体インスタンスを含んでいます。各インスタンスに対するこのような精密なピクセルごとの注釈は、詳細なシーン分析に不可欠な正確な位置特定を保証します。既存的小規模空中画像ベースのインスタンス分割データセットと比較すると、iSAIDはオブジェクトカテゴリ数が15倍、インスタンス数が5倍多いです。我々は自然環境向けの人気のある2つのインスタンス分割手法であるMask R-CNNとPANetを使用して、データセットをベンチマークしました。実験結果から、市販のMask R-CNNやPANetを直接空中画像に適用すると最適なインスタンス分割結果を得られないことが示されました。これにより、研究コミュニティからの専門的な解決策が必要であることが明らかになりました。データセットは公開されており、以下のURLからアクセスできます:https://captain-whu.github.io/iSAID/index.html

iSAID: 大規模な空中画像のインスタンスセグメンテーション用データセット | 最新論文 | HyperAI超神経