17日前
VDD:セマンティックセグメンテーション向けバリエーションドローンデータセット
Wenxiao Cai, Ke Jin, Jinyan Hou, Cong Guo, Letian Wu, Wankou Yang

要約
ドローン画像の意味分割は、地上のシーンを理解するための重要な意味情報を提供するため、さまざまな航空視覚タスクにおいて不可欠である。ドローン用の意味分割モデルの高精度を確保するためには、多様性に富み、大規模かつ高解像度のデータセットへのアクセスが不可欠であるが、航空画像処理分野ではこのようなデータセットはしばしば不足している。既存のデータセットは都市部のシーンに主眼を置いており、規模が限定的であることが一般的である。これに対して、本研究では7クラスにわたる400枚の高解像度画像から構成される大規模かつ密ラベル化されたデータセット「Varied Drone Dataset(VDD)」を提供することで、こうした課題を克服した。VDDは都市部、工業地帯、農村部および自然環境といった多様なシーンを、異なるカメラアングルおよび多様な照明条件下で撮影したものである。さらに、UDDおよびUAVidのデータに対して新たなラベル付けを施し、VDDのラベル付け基準に統合することで、統合ドローンデータセット(Integrated Drone Dataset, IDD)を構築した。本研究では、ドローン画像データセット上で7つの最先端モデルを学習し、基準モデルとしての性能を評価した。本データセットがドローン画像の意味分割分野における広範な関心を呼び起こし、他のドローン視覚タスクの基盤となることが期待される。データセットは、公開サイト(https://github.com/RussRobin/VDD)にて誰でも利用可能である。