HyperAI

مجموعة بيانات فهم الصور عن بُعد للغة البصرية GAIA

التاريخ

منذ 5 أشهر

الحجم

14.64 MB

المؤسسة

الجامعة التقنية الوطنية في أثينا

رابط النشر

github.com

GAIA هي مجموعة بيانات عالمية متعددة الوسائط ومتعددة المقاييس للرؤية واللغة لتحليل صور الاستشعار عن بعد والتي تهدف إلى سد الفجوة بين صور الاستشعار عن بعد وفهم اللغة الطبيعية. تم نشره في عام 2025 من قبل باحثين من الجامعة التقنية الوطنية في أثينا، وجامعة هاروكوبيو في أثينا، والجامعة التقنية في ميونيخ.GAIA: مجموعة بيانات عالمية متعددة الوسائط ومتعددة المقاييس للرؤية واللغة لتحليل صور الاستشعار عن بعدتوفر هذه المجموعة 205,150 زوجًا من الصور والنصوص (41,030 صورة، لكل منها 5 أوصاف تركيبية) لتطوير نماذج لغة الرؤية (VLMs) الخاصة بالاستشعار عن بُعد. تغطي مجموعة البيانات 25 عامًا من بيانات رصد الأرض (1998-2024)، وتغطي مجموعة متنوعة من المناطق الجغرافية، ومهام الأقمار الصناعية، وأساليب الاستشعار عن بُعد.

بنية مجموعة البيانات

تم تقسيم GAIA إلى مجموعة التدريب (70%)، ومجموعة الاختبار (20%)، ومجموعة التحقق (10%)، ويتم تقسيم هذه الأقسام حسب الزمان والمكان. يتم توفير تقسيم مجموعة البيانات كملف JSON متوافق مع أداة img2dataset. يتيح هذا النهج للباحثين الوصول بسلاسة إلى مجموعات البيانات وإعادة بنائها لأغراض البحث.

يحتوي كل إدخال على مجموعة من البيانات المستخرجة من الويب (على سبيل المثال، مصدر الصورة، ووصف الصورة، وإشعار حقوق النشر)، أو البيانات المستخرجة (على سبيل المثال، الموقع، والعلامات، والدقة، والقمر الصناعي، والمستشعر، والوسيلة)، أو البيانات المولدة بشكل مصطنع (على سبيل المثال، خط العرض، وخط الطول، والوصف).

GAIA-Multi-scale-Vision-Language.torrent
البذر 0التنزيل 1مكتمل 63إجمالي التنزيلات 89
  • GAIA-Multi-scale-Vision-Language/
    • README.md
      2.08 KB
    • README.txt
      4.16 KB
      • data/
        • GAIA.zip
          14.64 MB