HyperAIHyperAI
منذ 3 أيام

MeshCoder: توليد رموز الشبكة المنظمة ذات الهيكل المدعوم بالذكاء الاصطناعي من السحابات النقطية

Bingquan Dai, Li Ray Luo, Qihong Tang, Jie Wang, Xinyu Lian, Hao Xu, Minghan Qin, Xudong Xu, Bo Dai, Haoqian Wang, Zhaoyang Lyu, Jiangmiao Pang
MeshCoder: توليد رموز الشبكة المنظمة ذات الهيكل المدعوم بالذكاء الاصطناعي من السحابات النقطية
الملخص

إعادة بناء الأجسام ثلاثية الأبعاد إلى برامج قابلة للتعديل يُعد أمرًا حاسمًا في تطبيقات مثل الهندسة العكسية وتحرير الأشكال. ومع ذلك، تعتمد الطرق الحالية غالبًا على لغات محددة المجال محدودة (DSLs) وقواعد بيانات صغيرة الحجم، مما يحد من قدرتها على نمذجة الهندسات والهياكل المعقدة. لمعالجة هذه التحديات، نقدم إطار عمل جديد يُدعى MeshCoder، والذي يُعيد بناء الأجسام ثلاثية الأبعاد المعقدة من السحابات النقطية إلى نصوص برمجية قابلة للتعديل باستخدام لغة بايثون في برنامج Blender. وقد طوّرنا مجموعة شاملة من واجهات برمجة التطبيقات (APIs) التعبيرية في Blender، قادرة على إنشاء هندسات معقدة. وباستخدام هذه الواجهات، قمنا ببناء مجموعة بيانات كبيرة الحجم مزدوجة (مُزَوَّجة) تتضمن كودًا لكل جسم، حيث يتم تجزئة الكود الخاص بكل جسم إلى أجزاء ذات دلالة منفصلة. ثم قمنا بتدريب نموذج لغة كبيرة متعددة الوسائط (LLM) قادر على ترجمة السحابة النقطية ثلاثية الأبعاد إلى نصوص برمجية قابلة للتنفيذ في Blender. لا يحقق هذا النهج أداءً متميزًا في مهام إعادة بناء الشكل إلى الكود فحسب، بل يُسهّل أيضًا عمليات التحرير الهندسي والهندسي الشبكي (الهندسة الطوبولوجية) بطريقة مبسطة من خلال تعديلات برمجية سهلة. علاوة على ذلك، يعزز التمثيل القائم على الكود القدرات الاستنتاجية لنموذج LLM في مهام فهم الأشكال ثلاثية الأبعاد. وبشكل جماعي، تمثل هذه المساهمات إرساء MeshCoder كحل قوي ومرن لمهام إعادة بناء الأشكال ثلاثية الأبعاد وفهمها باستخدام البرمجة.