Command Palette
Search for a command to run...
Modélisation du monde en 3D et en 4D : Un état de l'art

Résumé
La modélisation du monde est devenue un pilier fondamental de la recherche en intelligence artificielle, permettant aux agents de comprendre, représenter et prédire les environnements dynamiques qu’ils habitent. Bien que les travaux antérieurs mettent principalement l’accent sur les méthodes génératives appliquées aux données 2D d’images et de vidéos, ils négligent le volume croissant de recherches exploitant des représentations natives 3D et 4D — telles que les images RGB-D, les maillages d’occupation ou les nuages de points LiDAR — pour la modélisation à grande échelle des scènes. Par ailleurs, l’absence d’une définition et d’une taxinomie standardisées pour le concept de « modèles du monde » a conduit à des affirmations fragmentées et parfois contradictoires dans la littérature. Ce survol comble ces lacunes en proposant la première revue exhaustive explicitement dédiée à la modélisation et à la génération 3D et 4D. Nous établissons des définitions précises, introduisons une taxinomie structurée couvrant les approches basées sur les vidéos (VideoGen), celles fondées sur l’occupation (OccGen) et celles basées sur les données LiDAR (LiDARGen), et synthétisons de manière systématique les jeux de données et les métriques d’évaluation adaptés aux contextes 3D/4D. Nous discutons également des applications pratiques, identifions les défis ouverts et mettons en lumière des directions de recherche prometteuses, dans l’objectif de fournir une référence cohérente et fondamentale pour l’avancement du domaine. Un résumé systématique de la littérature existante est disponible à l’adresse suivante : https://github.com/worldbench/survey
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.