Étape par étape : Reconstruction de séquences de construction CAO à partir de nuages de points via une diffusion multimodale.

La reconstruction des séquences de construction CAD à partir de la géométrie 3D brute constitue un pont entre les objets du monde réel et les conceptions numériques. Dans cet article, nous proposons CAD-Diffuser, un modèle diffusion multimodal visant à intégrer le paradigme de conception haut-en-bas dans la reconstruction générative. Plus précisément, nous unifions les nuages de points CAD et les séquences de construction CAD au niveau des tokens, guidant ainsi notre stratégie de diffusion multimodale pour comprendre et relier la géométrie au sens de conception concentré dans les séquences de construction. Grâce aux puissantes capacités de décodage des modèles linguistiques, le processus direct est modélisé comme une marche aléatoire entre le token original et le token [MASK], tandis que le processus inverse s’inscrit naturellement dans le cadre de modélisation des tokens masqués. Un calendrier de bruit basé sur le volume est conçu afin de favoriser une génération par contours d’abord, décomposant ainsi la méthodologie de conception haut-en-bas en une procédure compréhensible par la machine. Pour le tokenisation des données CAD de différentes modalités, nous introduisons un tokenizer incluant une tâche auto-supervisée de segmentation des faces, permettant de compresser à la fois les informations géométriques locales et globales pour les nuages de points CAD, tandis que la séquence de construction CAD est transformée en une chaîne de tokens de primitives. Les résultats expérimentaux montrent que CAD-Diffuser parvient à capter les détails géométriques et que les résultats obtenus sont plus susceptibles d’être réutilisés par des concepteurs humains.