Command Palette
Search for a command to run...
Ensemble De Données 3EED Pour La Compréhension 3D Basée Sur Le Langage
Date
Taille
URL du document
Licence
Apache 2.0
Balises
3EED est un ensemble de données d'ancrage visuel 3D multiplateforme et multimodal, publié en 2025 par l'Université des sciences et technologies de Hong Kong (Guangzhou), en collaboration avec l'Université technologique de Nanyang et d'autres institutions. L'article de recherche associé s'intitule « 3EED : Ancrez tout partout en 3DLa méthode proposée a été acceptée par NeurIPS 2025 et vise à aider les modèles à effectuer des tâches de localisation d'objets 3D pilotées par le langage dans des scénarios extérieurs réels, et à évaluer de manière exhaustive la robustesse multiplateforme et les capacités de compréhension spatiale du modèle.
Cet ensemble de données contient 20 367 images multimodales synchronisées, couvrant trois plateformes : véhicules, drones et quadrupèdes. Il fournit 128 735 boîtes englobantes 3D et 22 439 expressions de référence linguistiques vérifiées manuellement, soit près de dix fois plus que les ensembles de données existants du même type. De plus, l’espace de la scène de données s’étend jusqu’à 280 m × 240 m × plus de 80 m, soit un ordre de grandeur supérieur à celui des ensembles de données de référence 3D extérieurs existants, offrant des conditions uniques pour étudier la compréhension 3D réelle à longue distance, à différentes échelles et selon de multiples perspectives.

Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.