HyperAIHyperAI

Command Palette

Search for a command to run...

الحركة التبادلية: توليد حركة الإنسان ثلاثية الأبعاد الموجهة بالنص باستخدام نموذج التبادل

Zhiyuan Ren Zhihong Pan Xin Zhou Le Kang

الملخص

نُقدِّم طريقة بسيطة وحديثة لاستخلاص الحركة ثلاثية الأبعاد للإنسان من جمل لغوية معقدة في الطبيعة، تصف سرعة مختلفة، واتجاهات، وتركيبات متنوعة لأنواع متعددة من الحركات. على عكس الطرق الحالية التي تعتمد على الهياكل التوليدية الكلاسيكية، نستخدم نموذج التفتيت الاحتمالي المُزيل للضوضاء (Denoising Diffusion Probabilistic Model) في هذه المهمة، حيث يتم توليد نتائج حركية متنوعة بقيادة نصية. يقوم نموذج التفتيت بتحويل الضوضاء البيضاء إلى حركة ثلاثية الأبعاد منظمة من خلال عملية ماركوف تتضمن سلسلة من خطوات إزالة الضوضاء، ويتم تدريبه بكفاءة من خلال تحسين حد أدنى تبادلي (variational lower bound). ولتحقيق هدف توليد الصور المعتمدة على النص، نستخدم استراتيجية التوجيه بدون تصنيف (classifier-free guidance) لدمج تضمينات النص داخل النموذج أثناء التدريب. تُظهر تجاربنا أن النموذج يحقق نتائج تنافسية على مجموعة اختبار HumanML3D من حيث الجوانب الكمية، ويُنتج أمثلة أكثر طبيعية بصريًا وتنوعًا. كما نُظهر من خلال التجارب أن النموذج قادر على توليد حركات بحالة الصفر (zero-shot) للنصوص غير المرئية مسبقًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الحركة التبادلية: توليد حركة الإنسان ثلاثية الأبعاد الموجهة بالنص باستخدام نموذج التبادل | مستندات | HyperAI