HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 20 أيام

نص إلى التجميع الروبوتي للأشياء متعددة المكونات باستخدام الذكاء الاصطناعي التوليدي ثلاثي الأبعاد ونماذج الرؤية واللغة

نص إلى التجميع الروبوتي للأشياء متعددة المكونات باستخدام الذكاء الاصطناعي التوليدي ثلاثي الأبعاد ونماذج الرؤية واللغة

الملخص

أدى التقدم في الذكاء الاصطناعي التوليدي ثلاثي الأبعاد إلى إمكانية إنشاء كائنات مادية من خلال أوامر نصية، لكن ما يزال هناك تحديات في إنشاء كائنات تتضمن أنواعًا متعددة من المكونات. نقدّم نموذجًا متكاملًا يدمج الذكاء الاصطناعي التوليدي ثلاثي الأبعاد مع نماذج الرؤية واللغة (VLMs) لتمكين الروبوتات من تجميع كائنات متعددة المكونات من لغة طبيعية. تعتمد طريقة العمل هذه على استخدام نماذج الرؤية واللغة لاستنتاجات متعددة الوسائط وصفرية المعاينة حول الشكل والوظيفة، بهدف تفكيك الشبكات المولّدة بواسطة الذكاء الاصطناعي إلى نماذج ثلاثية الأبعاد متعددة المكونات، باستخدام مكونات بنائية وصفائح مُحددة مسبقًا. ونُظهر أن نموذج VLM قادر على تحديد أي من مناطق الشبكة تتطلب مكونات صفائح إضافية إلى جانب المكونات البنائية، استنادًا إلى وظيفة الكائن. وتشير التقييمات المُنفَّذة على كائنات اختبارية إلى أن المستخدمين اختاروا التخصيصات المُولَّدة بواسطة VLM بنسبة 90.6%، مقارنة بـ 59.4% للنماذج القائمة على القواعد، و2.5% للتخصيصات العشوائية. وأخيرًا، يتيح النظام للمستخدمين تحسين تخصيصات المكونات من خلال مدخلات تفاعلية بالمحادثة، مما يعزز من التحكم البشري والسلطة في إنشاء كائنات مادية باستخدام الذكاء الاصطناعي التوليدي والروبوتات.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
نص إلى التجميع الروبوتي للأشياء متعددة المكونات باستخدام الذكاء الاصطناعي التوليدي ثلاثي الأبعاد ونماذج الرؤية واللغة | الأوراق البحثية | HyperAI