HyperAIHyperAI
منذ 2 أشهر

ديسكورد: التحويل من الرموز المتقطعة إلى الحركة المستمرة عبر التدفق المصحح فك التشفير

Jungbin Cho, Junwan Kim, Jisoo Kim, Minseo Kim, Mingu Kang, Sungeun Hong, Tae-Hyun Oh, Youngjae Yu
ديسكورد: التحويل من الرموز المتقطعة إلى الحركة المستمرة عبر التدفق المصحح
  فك التشفير
الملخص

الحركة البشرية، التي تتميز بطابعها المستمر والديناميكي، تشكل تحديات كبيرة للنماذج التوليدية. رغم هيمنتها، تعاني الطرق الكمية المتقطعة مثل VQ-VAEs من قيود جوهرية، بما في ذلك التعبير المحدود والضوضاء الإطارية. بينما تنتج الطرق المستمرة حركات أكثر سلاسة وطبيعة، فإنها غالباً ما تعثر بسبب التعقيد عالي البعد وقلة البيانات التدريبية. لحل هذا "التناقض" بين التمثيلات المتقطعة والمستمرة، نقدم DisCoRD: تحويل الرموز المتقطعة إلى حركة مستمرة عبر فك التدفق المصحح (Discrete Tokens to Continuous Motion via Rectified Flow Decoding)، وهو طريقة جديدة تقوم بفك الرموز الحركية المتقطعة إلى حركة مستمرة من خلال التدفق المصحح. عن طريق استخدام عملية تحسين متكررة في الفضاء المستمر، يتمكن DisCoRD من التقاط الديناميات الدقيقة ويضمن حركات أكثر سلاسة وطبيعة. متوافقة مع أي إطار عمل يستند إلى التمثيلات المتقطعة، تحسن طرقتنا الطبيعة دون المساس بالوفاء للإشارات المشروطة. أظهرت التقييمات الواسعة أن DisCoRD يحقق أداءً رائدًا، حيث بلغ مؤشر FID 0.032 على HumanML3D و0.169 على KIT-ML. هذه النتائج تؤكد أن DisCoRD هو حل قوي لتقريب الفجوة بين كفاءة التمثيلات المتقطعة وواقعية الحركة المستمرة. صفحة المشروع متاحة على الرابط: https://whwjdqls.github.io/discord.github.io/.

ديسكورد: التحويل من الرموز المتقطعة إلى الحركة المستمرة عبر التدفق المصحح فك التشفير | أحدث الأوراق البحثية | HyperAI