ISPRS 都市セグメンテーション リモート センシング データ セット

データセットの背景
写真測量における主なトピックの 1 つは、航空機センサーによって取得されたデータから都市オブジェクトを自動的に抽出することです。建物、道路、樹木、車などのオブジェクトは高解像度データでは非常に不均一に見えるため、このタスクは困難です。その結果、クラス内の分散が高く、クラス間の分散が低くなります。詳細な 2D セマンティック セグメンテーションに焦点を当て、複数のオブジェクト カテゴリにラベルを割り当てます。さらに研究を推進するのは、新しいセンサーからの高解像度データと、ますます高度化する機械学習技術に依存する高度な処理技術です。多大な努力にもかかわらず、これらの課題はまだ解決されたとは言えません。私たちの知る限り、この課題に取り組むために少なくとも 20 年以上の研究が行われてきたにもかかわらず、現在、完全に自動化された 2D オブジェクト認識方法は実際に使用されていません。科学の進歩を妨げる主な問題は、オブジェクトの抽出を評価するための標準データセットが不足しており、さまざまな方法の結果を実験的に比較することが困難であることです。このデータセットは、この問題を解決することを目的としています。
この目的を達成するために、研究チームは、非常に高解像度の True Orthophoto (TOP) タイルで構成される 2 つの最先端の航空画像データセットを提供します。どちらのエリアも都市部のシーンをカバーします。ファイインゲンは独立した建物や小さな複数階建ての建物が多くある比較的小さな村ですが、ポツダムは大きな複合施設、狭い通り、密集した集落構造を持つ典型的な歴史都市です。
データセットの構造
このデータセットには、ヴァイヒンゲ、ポツダム、トロントなどの都市部の 2D セマンティック セグメンテーションが含まれています。
各データセットは、最も一般的な 6 つの土地被覆カテゴリに手動で分類されました。
- 不浸透性表面 (BGR: 255、255、255)
- 建物 (BGR: 0、0、255)
- 低植生 (BGR: 0、255、255)
- ツリー (BGR: 0、255、0)
- オート(BGR:255、255、0)
- クラッター/背景 (BGR: 255、0、0)
クラッター/背景クラスには、水域 (川の一部を含む 2 つの画像に表示されます) および他のオブジェクト (輸送用コンテナ、テニスコート、プールなど) とは非常に異なって見えるその他のオブジェクトが含まれており、通常はセマンティック オブジェクトには関係ありません。都市でのシーンでの分類。