HyperAIHyperAI

Command Palette

Search for a command to run...

in2IN: الاستفادة من المعلومات الفردية لتوليد التفاعلات البشرية

Pablo Ruiz Ponce German Barquero Cristina Palmero Sergio Escalera Jose Garcia-Rodriguez

الملخص

تُعدّ توليد التفاعلات الحركية بين البشر بناءً على وصف نصي تطبيقًا مفيدًا جدًا في مجالات متعددة مثل الروبوتات، والألعاب، والتحريك، وعالم الميتافيرس. ومع هذه الفائدة الكبيرة، تأتي صعوبة كبيرة في نمذجة الديناميكيات بين الأشخاص ذات الأبعاد العالية. علاوةً على ذلك، يواجه التمثيل الدقيق لتنوع التفاعلات داخل الفرد (الداخلية) تحديات كبيرة. تُولّد الطرق الحالية تفاعلات ذات تنوع محدود في الديناميكيات الداخلية، نظرًا لقيود البيانات المتاحة واستراتيجيات التوجيه المستخدمة. ولحل هذه المشكلة، نقدّم نموذجًا جديدًا يُسمّى in2IN، وهو نموذج تمايز (Diffusion Model) مُخصص لتوليد الحركات بين البشر، يُوجَّه ليس فقط بالوصف النصي العام للتفاعل، بل أيضًا بالوصف الفردي للحركات التي يقوم بها كل شخص مشارك في التفاعل. لتدريب هذا النموذج، نستخدم نموذج لغة كبير (Large Language Model) لتوسيع مجموعة بيانات InterHuman بإضافة وصفات فردية. وبذلك، يحقق in2IN أداءً متفوقًا على مستوى الحالة الحالية (State-of-the-art) في مجموعة بيانات InterHuman. بالإضافة إلى ذلك، لزيادة تنوع الحركات الفردية في المجموعات الحالية للتفاعلات، نقترح DualMDM، وهي تقنية تكوين نماذج تدمج الحركات التي يولدها in2IN مع الحركات التي يولدها نموذج أولي لحركة فردية تم تدريبه مسبقًا على مجموعة بيانات HumanML3D. وبذلك، يُولّد DualMDM حركات ذات تنوع فردي أعلى، ويُحسّن التحكم في الديناميكيات الداخلية، مع الحفاظ على التماسك بين الأشخاص.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp