HyperAIHyperAI

Command Palette

Search for a command to run...

نموذج تمايز الحركة البشرية

Guy Tevet Sigal Raab Brian Gordon Yonatan Shafir Daniel Cohen-Or Amit H. Bermano

الملخص

إن توليد الحركة البشرية الطبيعية والتعبيرية يُعدّ الحلم الأسمى في مجال الرسوم المتحركة الحاسوبية. ويشكّل هذا المهمة تحديًا كبيرًا نظرًا لتنوع الحركات الممكنة، وحساسية الإنسان تجاهها، وصعوبة وصفها بدقة. ولهذا السبب، تظل الحلول التوليدية الحالية إما منخفضة الجودة أو محدودة من حيث التعبير. وتعتبر نماذج الانتشار (Diffusion models)، التي أظهرت بالفعل قدرات توليدية مميزة في مجالات أخرى، مرشّحات واعدة لمعالجة حركة الإنسان بفضل طبيعتها متعددة-إلى-متعددة، لكنها غالبًا ما تكون مكلفة من حيث الموارد وصعبة التحكم بها. في هذه الورقة، نقدّم نموذج الانتشار للحركة (Motion Diffusion Model أو MDM)، وهو نموذج توليدي مبني على الانتشار دون تصنيف، مُعدّل بدقة خصيصًا ل domaine حركة الإنسان. يعتمد MDM على هيكل المُحَوِّل (Transformer)، ويعتمد على رؤى مستمدة من الأدبيات السابقة في مجال توليد الحركة. وتميّز تصميم ملحوظ هو تنبؤ النموذج بالعينة الفعلية، وليس بالضجيج، في كل خطوة من خطوات الانتشار. وهذا يسهّل استخدام خسائر هندسية مُثبتة على مواقع وسرعات الحركة، مثل خسارة لمس القدم. كما نُظهر في هذه الدراسة أن MDM نهج عام، يمكّن من استخدام أنماط مختلفة من الشروط (conditioning) ومهمات توليد متعددة. ونُثبت أن النموذج يُدرّس باستخدام موارد خفيفة، ومع ذلك يحقق نتائج رائدة (state-of-the-art) على أبرز المعايير المعيارية في مهام تحويل النص إلى حركة (text-to-motion) وتحويل الفعل إلى حركة (action-to-motion).https://guytevet.github.io/mdm-page/


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp