Command Palette
Search for a command to run...
Ensemble De Données 3EED Pour La Compréhension 3D Basée Sur Le Langage
Date
Size
Paper URL
License
Apache 2.0
3EED est un ensemble de données d'ancrage visuel 3D multiplateforme et multimodal, publié en 2025 par l'Université des sciences et technologies de Hong Kong (Guangzhou), en collaboration avec l'Université technologique de Nanyang et d'autres institutions. L'article de recherche associé s'intitule « 3EED : Ancrez tout partout en 3DLa méthode proposée a été acceptée par NeurIPS 2025 et vise à aider les modèles à effectuer des tâches de localisation d'objets 3D pilotées par le langage dans des scénarios extérieurs réels, et à évaluer de manière exhaustive la robustesse multiplateforme et les capacités de compréhension spatiale du modèle.
Cet ensemble de données contient 20 367 images multimodales synchronisées, couvrant trois plateformes : véhicules, drones et quadrupèdes. Il fournit 128 735 boîtes englobantes 3D et 22 439 expressions de référence linguistiques vérifiées manuellement, soit près de dix fois plus que les ensembles de données existants du même type. De plus, l’espace de la scène de données s’étend jusqu’à 280 m × 240 m × plus de 80 m, soit un ordre de grandeur supérieur à celui des ensembles de données de référence 3D extérieurs existants, offrant des conditions uniques pour étudier la compréhension 3D réelle à longue distance, à différentes échelles et selon de multiples perspectives.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.