HyperAIHyperAI

Command Palette

Search for a command to run...

ديسكورد: التحويل من الرموز المتقطعة إلى الحركة المستمرة عبر التدفق المصحح فك التشفير

Jungbin Cho Junwan Kim Jisoo Kim Minseo Kim Mingu Kang Sungeun Hong Tae-Hyun Oh Youngjae Yu

الملخص

الحركة البشرية، التي تتميز بطابعها المستمر والديناميكي، تشكل تحديات كبيرة للنماذج التوليدية. رغم هيمنتها، تعاني الطرق الكمية المتقطعة مثل VQ-VAEs من قيود جوهرية، بما في ذلك التعبير المحدود والضوضاء الإطارية. بينما تنتج الطرق المستمرة حركات أكثر سلاسة وطبيعة، فإنها غالباً ما تعثر بسبب التعقيد عالي البعد وقلة البيانات التدريبية. لحل هذا "التناقض" بين التمثيلات المتقطعة والمستمرة، نقدم DisCoRD: تحويل الرموز المتقطعة إلى حركة مستمرة عبر فك التدفق المصحح (Discrete Tokens to Continuous Motion via Rectified Flow Decoding)، وهو طريقة جديدة تقوم بفك الرموز الحركية المتقطعة إلى حركة مستمرة من خلال التدفق المصحح. عن طريق استخدام عملية تحسين متكررة في الفضاء المستمر، يتمكن DisCoRD من التقاط الديناميات الدقيقة ويضمن حركات أكثر سلاسة وطبيعة. متوافقة مع أي إطار عمل يستند إلى التمثيلات المتقطعة، تحسن طرقتنا الطبيعة دون المساس بالوفاء للإشارات المشروطة. أظهرت التقييمات الواسعة أن DisCoRD يحقق أداءً رائدًا، حيث بلغ مؤشر FID 0.032 على HumanML3D و0.169 على KIT-ML. هذه النتائج تؤكد أن DisCoRD هو حل قوي لتقريب الفجوة بين كفاءة التمثيلات المتقطعة وواقعية الحركة المستمرة. صفحة المشروع متاحة على الرابط: https://whwjdqls.github.io/discord.github.io/.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp