HyperAI超神经

GAIA 视觉语言遥感图像理解数据集

日期

3 个月前

大小

14.64 MB

机构

National Technical University of Athens

发布地址

github.com

GAIA 是一个用于遥感图像分析的全球性、多模态、多尺度视觉-语言数据集,旨在弥合遥感 (RS) 图像与自然语言理解之间的差距,由雅典国立技术大学、雅典哈罗科皮奥大学和慕尼黑工业大学的研究人员于 2025 年发布,相关论文成果为「GAIA: A Global, Multi-modal, Multi-scale Vision-Language Dataset for Remote Sensing Image Analysis」。它提供了 205,150 对图像-文本配对(41,030 张图像,每张图像配备 5 个合成描述),以推动特定于遥感的视觉-语言模型 (VLMs) 的发展。该数据集涵盖了 25 年的地球观测数据(1998-2024 年),覆盖了多样化的地理区域、卫星任务和遥感模态。

数据集结构

GAIA 已被划分为训练集 (70%) 、测试集 (20%) 和验证集 (10%),这些划分在时空上是分层的。数据集的划分以与 img2dataset 工具兼容的 JSON 文件形式提供。这种方法使得研究人员能够无缝访问和重建数据集,以便用于研究目的。

每个条目包含一组网络爬取的数据(例如,图像来源、图像描述、版权声明)、提取的数据(例如,位置、标签、分辨率、卫星、传感器、模态)或合成生成的数据(例如,纬度、经度、描述)。

GAIA-Multi-scale-Vision-Language.torrent
做种 0正在下载 1已完成 21总下载次数 58
  • GAIA-Multi-scale-Vision-Language/
    • README.md
      2.08 KB
    • README.txt
      4.16 KB
      • data/
        • GAIA.zip
          14.64 MB