
摘要
无人机图像的语义分割在各类航空视觉任务中具有关键作用,因为它能够提供理解地面场景所需的丰富语义信息。要确保无人机语义分割模型的高精度,通常需要依赖多样、大规模且高分辨率的数据集,然而在航空图像处理领域,这类数据集往往十分稀缺。现有数据集大多聚焦于城市场景,且规模相对有限。为此,我们提出了多样化无人机数据集(Varied Drone Dataset, VDD),该数据集包含400张高分辨率图像,覆盖7个语义类别,具有大规模、密集标注的特点。VDD涵盖城市、工业、乡村及自然等多种场景,图像由不同相机视角拍摄,并在多种光照条件下采集,具有较强的场景多样性与实用性。此外,我们还对现有的UDD和UAVid数据集进行了新的标注,并统一采用VDD的标注标准,整合形成集成无人机数据集(Integrated Drone Dataset, IDD),进一步提升了数据集的一致性与可用性。为建立基准性能,我们在无人机图像数据集上训练了七种当前最先进的语义分割模型。我们预期,VDD和IDD将激发学术界和工业界对无人机图像分割的广泛关注,并为其他无人机视觉任务提供坚实的数据基础。相关数据集已公开发布,可通过以下链接访问:https://github.com/RussRobin/VDD。