GAIA 是一个用于遥感图像分析的全球性、多模态、多尺度视觉-语言数据集,旨在弥合遥感 (RS) 图像与自然语言理解之间的差距,由雅典国立技术大学、雅典哈罗科皮奥大学和慕尼黑工业大学的研究人员于 2025 年发布,相关论文成果为「GAIA: A Global, Multi-modal, Multi-scale Vision-Language Dataset for Remote Sensing Image Analysis」。它提供了 205,150 对图像-文本配对(41,030 张图像,每张图像配备 5 个合成描述),以推动特定于遥感的视觉-语言模型 (VLMs) 的发展。该数据集涵盖了 25 年的地球观测数据(1998-2024 年),覆盖了多样化的地理区域、卫星任务和遥感模态。
数据集结构
GAIA 已被划分为训练集 (70%) 、测试集 (20%) 和验证集 (10%),这些划分在时空上是分层的。数据集的划分以与 img2dataset 工具兼容的 JSON 文件形式提供。这种方法使得研究人员能够无缝访问和重建数据集,以便用于研究目的。
每个条目包含一组网络爬取的数据(例如,图像来源、图像描述、版权声明)、提取的数据(例如,位置、标签、分辨率、卫星、传感器、模态)或合成生成的数据(例如,纬度、经度、描述)。

GAIA-Multi-scale-Vision-Language.torrent
做种 0正在下载 1已完成 21总下载次数 58