Ensemble De Données Auto-supervisé De Conscience Spatiale SSRL-81k
Date
URL de l'article
Licence
Non-Commercial
Spatial-SSRL-81k est un ensemble de données d'apprentissage auto-supervisé de vision et de langage pour la compréhension et le raisonnement spatiaux, publié en 2025 par le Laboratoire d'intelligence artificielle de Shanghai en collaboration avec l'Université Jiao Tong de Shanghai, l'Université chinoise de Hong Kong et d'autres institutions. L'article de recherche associé est intitulé « ... ».« Spatial-SSRL : Améliorer la compréhension spatiale grâce à l’apprentissage par renforcement auto-supervisé »L'objectif est de doter les grands modèles de capacités de perception spatiale ne nécessitant pas d'annotation manuelle, améliorant ainsi leurs performances de raisonnement et de généralisation dans des scénarios multimodaux.
Cet ensemble de données contient 81 053 exemples de questions-réponses générés automatiquement, construits à partir d'images COCO RGB et d'images DIODE et MegaDepth RGB-D. Il couvre divers formats de questions, notamment des tâches de classement, des questions à choix multiples avec options d'image et des questions à choix multiples avec options de texte, représentant différents scénarios réels, en intérieur comme en extérieur.

Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.