Ensemble De Données De Rendu 3D De Scènes Intérieures SceneSplat-7K
Date
URL de publication
URL de l'article
Licence
CC BY-SA 4.0
SceneSplat-7K a été publié en 2025 par l'Université d'Amsterdam, le Laboratoire de vision par ordinateur de l'École polytechnique fédérale de Zurich, l'INSAIT de l'Université de Sofia et d'autres institutions. Il s'agit actuellement du jeu de données 3D Gaussian Splats (3DGS) de scènes d'intérieur le plus vaste et le plus qualitatif. Les résultats de l'étude sont les suivants :SceneSplat : Compréhension de scènes basée sur l'éclaboussure gaussienne avec pré-entraînement visuo-langagier", qui vise à promouvoir les capacités de compréhension et de raisonnement sémantique des modèles de pré-formation vision-langage dans des scènes 3D intérieures réelles.
Cet ensemble de données compile des données 3DGS générées à partir de plusieurs sources, totalisant environ 9 000 scènes originales. Parmi celles-ci, 7 916 scènes ont été traitées en 3DGS, chacune contenant en moyenne 1,42 million de points gaussiens, pour un total de 11,27 milliards de points gaussiens. Sur cette base, 4 114 scènes de haute qualité ont été sélectionnées pour le pré-apprentissage. L'ensemble de données comprend également 4,72 millions d'images RVB, démontrant une excellente qualité de reconstruction : PSNR moyen = 29,64 dB, erreur de profondeur moyenne = 0,035 m, SSIM moyen = 0,897 et LPIPS moyen = 0,212.