VRSBench Ensemble De Données De Référence En Langage Visuel De Télédétection À Grande Échelle Et De Haute Qualité
Date
Taille
URL de publication
Licence
CC BY-SA 4.0
Catégories

L'ensemble de données VRSBench a été proposé par l'Université des sciences et technologies du roi Abdallah en 2024, et les résultats de l'article associé sont "VRSBench : un ensemble de données de référence polyvalent en vision et en langage pour la compréhension des images de télédétection".
VRSBench est un ensemble de données de référence polyvalent en langage de vision conçu pour la compréhension des images de télédétection, visant à faire progresser le développement de modèles généraux et à grande échelle en langage de vision pour les images de télédétection. L'ensemble de données contient 29 614 images sous-titrées détaillées vérifiées par l'homme, 52 472 références d'objets et 123 221 paires questions-réponses, prenant en charge la formation et l'évaluation de modèles vision-langage sur un large éventail de tâches de compréhension d'images de télédétection.