HyperAIHyperAI

Command Palette

Search for a command to run...

دمج الذكاء الاصطناعي التوليدي مع القوانين الفيزيائية لإنشاء أشياء شخصية قابلة للعمل في العالم الحقيقي

تواجه نماذج الذكاء الاصطناعي التوليدي (genAI) تحديًا كبيرًا عند تصميم أشياء شخصية مثل الأكواب أو الأدوات الزخرفية: فهي تُنتج تصاميم مذهلة بصريًا، لكنها غالبًا ما تكون غير قابلة للتطبيق في العالم الحقيقي بسبب نقص فهمها للقوانين الفيزيائية. على سبيل المثال، قد تُصمم كرسيًا بذكاء اصطناعي يُبدو مثاليًا، لكنه ينهار عند استخدامه بسبب توزيع غير صحيح للوزن أو أجزاء منفصلة. لحل هذه المشكلة، طوّر باحثون من مختبر علوم الحاسوب والذكاء الاصطناعي في ماساتشوستس (CSAIL) نظامًا جديدًا يُسمى "فيزيوبيت" (PhysiOpt)، يدمج الذكاء الاصطناعي التوليدي مع محاكاة فيزيائية دقيقة. يسمح النظام للمستخدمين بوصف ما يريدون إنشاءه — سواء بكتابة نص أو رفع صورة — ثم يُولّد نموذجًا ثلاثي الأبعاد جاهزًا للطباعة، مع ضمان متانة التصميم ووظيفته في الواقع. يبدأ النظام بتحليل التصميم باستخدام "تحليل العناصر المنتهية" (Finite Element Analysis)، وهو أداة فيزيائية تُظهر بخريطة حرارية أين تكون الأجزاء ضعيفة أو معرضة للانهيار. ثم يقوم النظام بإجراء تعديلات دقيقة على التفاصيل الصغيرة، مثل تقوية الأعمدة أو تغيير سمك الجدران، دون التأثير على الشكل العام أو الجمالية. هذا التحسين التلقائي يضمن أن الكوب يبقى ثابتًا عند وضعه على الطاولة، أو أن المفتاح المعلق لا ينفصل عند تعليق ملابس ثقيلة. يتميز فيزيوبيت بأنه سريع ومرن: يُنتج نموذجًا جاهزًا للطباعة خلال نحو 30 ثانية. كما يمكنه التكرار والتحسين دون الحاجة إلى تدريب إضافي، ما يجعله مناسبًا للاستخدام اليومي. يُمكن للمستخدم تحديد المواد المستخدمة (مثل البلاستيك أو الخشب)، وطريقة الدعم (كما في الكوب الذي يقف على الأرض مقابل الكتاب المائل الذي يعتمد على الدعم الجانبي)، مما يعزز دقة المحاكاة. أظهرت التجارب أن فيزيوبيت أسرع بعشر مرات لكل تكرار مقارنة بنظام مشابه يُسمى "DiffIPC"، مع إنتاج تصاميم أكثر واقعية. كما أن استخدام نموذج مُدرّب مسبقًا (pre-trained model) يمنح النظام فهمًا طبيعيًا للأشكال، مما يشبه فنانًا يُقلّد أسلوبًا معينًا بدقة. يُتوقع أن يُمكّن هذا النظام من تحويل الأفكار الجميلة إلى أشياء قابلة للاستخدام، من كوب على شكل طائر فلامينغو إلى حامل مفاتيح مبتكر. وفي المستقبل، قد يُدمج مع نماذج لغة ورؤية حاسوبية (Vision-Language Models) لتمكين النظام من فهم التحديات الواقعية تلقائيًا، دون الحاجة إلى تفاصيل مسبقة من المستخدم. تم دعم البحث من قبل مختبر MIT-IBM Watson للذكاء الاصطناعي وشركة Wistron، وتم عرضه في مؤتمر SIGGRAPH Asia 2023، الذي يُعد أحد أبرز الفعاليات العالمية في مجال الرسوميات الحاسوبية والتقنيات التفاعلية.

الروابط ذات الصلة