HyperAI초신경

GAIA 시각 언어 원격 감지 이미지 이해 데이터 세트

GAIA는 원격 감지 이미지 분석을 위한 글로벌, 다중 모드, 다중 스케일 비전-언어 데이터 세트로, 원격 감지(RS) 이미지와 자연어 이해 간의 격차를 메우는 것을 목표로 합니다. 이 논문은 아테네 국립기술대학, 아테네 하로코피오대학, 뮌헨기술대학의 연구자들에 의해 2025년에 출판되었습니다.GAIA: 원격 감지 이미지 분석을 위한 글로벌, 다중 모달, 다중 스케일 비전 언어 데이터 세트". 이 데이터셋은 원격 탐사에 특화된 시각 언어 모델(VLM) 개발을 지원하기 위해 205,150개의 이미지-텍스트 쌍(각각 5개의 합성 설명을 포함하는 41,030개의 이미지)을 제공합니다. 이 데이터셋은 다양한 지리적 영역, 위성 임무 및 원격 탐사 방식을 포함하는 25년간의 지구 관측 데이터(1998-2024)를 포함합니다.

데이터 세트 구조

GAIA는 훈련 세트(70%), 테스트 세트(20%), 검증 세트(10%)로 분할되었으며, 이러한 분할은 시간과 공간에 따라 계층화되어 있습니다. 데이터 세트의 분할은 img2dataset 도구와 호환되는 JSON 파일로 제공됩니다. 이러한 접근 방식을 통해 연구자는 연구 목적으로 데이터 세트에 원활하게 접근하고 재구성할 수 있습니다.

각 항목에는 웹에서 스크래핑한 데이터(예: 이미지 출처, 이미지 설명, 저작권 고지), 추출한 데이터(예: 위치, 태그, 해상도, 위성, 센서, 모달리티) 또는 합성적으로 생성된 데이터(예: 위도, 경도, 설명)가 포함되어 있습니다.

GAIA-Multi-scale-Vision-Language.torrent
시딩 0다운로드 중 1완료됨 21총 다운로드 횟수 54
  • GAIA-Multi-scale-Vision-Language/
    • README.md
      2.08 KB
    • README.txt
      4.16 KB
      • data/
        • GAIA.zip
          14.64 MB