HyperAIHyperAI

Command Palette

Search for a command to run...

الانتباه الموجه لوصف الحركة القابل للتفسير

Karim Radouane Julien Lagarde Sylvie Ranwez Andon Tchechmedjiev

الملخص

تم مؤخرًا إجراء أعمال متنوعة وشاملة في مجال توليد الحركة البشرية المشروطة بالنص. ومع ذلك، فإن التقدم في الاتجاه المعاكس، وهو تسمية الحركة (motion captioning)، لم يشهد تطورًا مماثلًا. في هذا البحث، نقدم تصميم هندسي جديد يعزز جودة توليد النص من خلال التركيز على القابلية للتفهم عبر آليات الانتباه المكانية-الزمانية والتكيفية. لتشجيع التفكير البشري، نقترح طرقًا لتوجيه الانتباه أثناء التدريب، مع التركيز على المناطق الهيكلية ذات الصلة على مر الزمن وتمييز الكلمات المرتبطة بالحركة. نناقش ونقيس قابلية تفسير نموذجنا باستخدام الرسوم البيانية ذات الصلة وتوزيعات الكثافة. بالإضافة إلى ذلك، نستفيد من القابلية للتفهم لاستخلاص معلومات دقيقة عن الحركة البشرية، بما في ذلك تحديد موقع العمل، وتحديد أجزاء الجسم، وتمييز الكلمات المرتبطة بالحركة. أخيرًا، نناقش قابلية نقل أساليبنا إلى مهام أخرى. تظهر تجاربنا أن توجيه الانتباه يؤدي إلى تسميات قابلة للتفهم مع تعزيز الأداء مقارنة بأنظمة الطليعة غير القابلة للتفهم التي تحتوي على عدد أكبر من المعلمات. يمكن الوصول إلى الكود من الرابط التالي: https://github.com/rd20karim/M2T-Interpretable.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الانتباه الموجه لوصف الحركة القابل للتفسير | مستندات | HyperAI