HyperAI超神経

GAIA ビジュアル言語リモートセンシング画像理解データセット

GAIA は、リモート センシング (RS) 画像と自然言語理解のギャップを埋めることを目的とした、リモート センシング画像分析用のグローバル、マルチモーダル、マルチスケールの視覚言語データセットです。2025 年にアテネ国立工科大学、アテネ ハロコピオ大学、ミュンヘン工科大学の研究者によって公開されました。GAIA: リモートセンシング画像解析のためのグローバル、マルチモーダル、マルチスケールの視覚言語データセット「」。リモート センシング固有の視覚言語モデル (VLM) の開発を促進するために、205,150 個の画像とテキストのペア (それぞれ 5 つの合成説明を含む 41,030 個の画像) が提供されます。このデータセットは、多様な地理的領域、衛星ミッション、リモートセンシング手法を網羅した 25 年間の地球観測データ (1998 ~ 2024 年) を網羅しています。

データセットの構造

GAIA は、トレーニング セット (70%)、テスト セット (20%)、検証セット (10%) に分割されており、これらのパーティションは時間と空間で階層化されています。データセットのパーティション分割は、img2dataset ツールと互換性のある JSON ファイルとして提供されます。このアプローチにより、研究者は研究目的でデータセットにシームレスにアクセスし、再構築できるようになります。

各エントリには、Web スクレイピングされたデータ (画像ソース、画像の説明、著作権表示など)、抽出されたデータ (場所、タグ、解像度、衛星、センサー、モダリティなど)、または合成生成されたデータ (緯度、経度、説明など) のセットが含まれています。

GAIA-Multi-scale-Vision-Language.torrent
シーディング 0ダウンロード中 1ダウンロード完了 21総ダウンロード数 58
  • GAIA-Multi-scale-Vision-Language/
    • README.md
      2.08 KB
    • README.txt
      4.16 KB
      • data/
        • GAIA.zip
          14.64 MB