HyperAIHyperAI

Command Palette

Search for a command to run...

iSAID: 大規模な空中画像のインスタンスセグメンテーション用データセット

Syed Waqas Zamir Aditya Arora Akshita Gupta Salman Khan Guolei Sun Fahad Shahbaz Khan Fan Zhu Ling Shao Gui-Song Xia Xiang Bai

概要

既存のEarth Visionデータセットは、語義分割または物体検出に適しています。本研究では、空中画像におけるインスタンス分割のための初のベンチマークデータセットを紹介します。このデータセットは、インスタンスレベルの物体検出とピクセルレベルのセグメンテーションタスクを組み合わせています。自然環境でのインスタンス分割と比較して、空中画像には一意の課題が存在します。例えば、一枚の画像あたり非常に多くのインスタンス数、大きなオブジェクトサイズ変動、および多数の小さなオブジェクトなどがあります。我々の大規模で密集注釈された空中画像インスタンス分割データセット(iSAID)は、2,806枚の高解像度画像にわたる15カテゴリ合計655,451個の物体インスタンスを含んでいます。各インスタンスに対するこのような精密なピクセルごとの注釈は、詳細なシーン分析に不可欠な正確な位置特定を保証します。既存的小規模空中画像ベースのインスタンス分割データセットと比較すると、iSAIDはオブジェクトカテゴリ数が15倍、インスタンス数が5倍多いです。我々は自然環境向けの人気のある2つのインスタンス分割手法であるMask R-CNNとPANetを使用して、データセットをベンチマークしました。実験結果から、市販のMask R-CNNやPANetを直接空中画像に適用すると最適なインスタンス分割結果を得られないことが示されました。これにより、研究コミュニティからの専門的な解決策が必要であることが明らかになりました。データセットは公開されており、以下のURLからアクセスできます:https://captain-whu.github.io/iSAID/index.html


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています