تقدير الوضعية ثنائية الأبعاد وثلاثية الأبعاد وتعرف الحركات باستخدام التعلم العميق متعدد المهام

التعرف على الحركات وتقدير وضعية الإنسان مرتبطان ارتباطًا وثيقًا، ولكن يتم التعامل معهما عادةً كمهام منفصلة في الأدبيات العلمية. في هذا البحث، نقترح إطار عمل متعدد المهام لتقدير الوضعية ثنائية الأبعاد وثلاثية الأبعاد من الصور الثابتة والتعرف على حركات الإنسان من سلاسل الفيديو. نوضح أن يمكن استخدام هندسة واحدة لحل المسألتين بطريقة فعالة وفي الوقت نفسه تحقيق نتائج رائدة في المجال. بالإضافة إلى ذلك، نبين أن التحسين من النهاية إلى النهاية يؤدي إلى دقة أعلى بكثير مقارنة بالتعلم المنفصل. يمكن تدريب الهندسة المقترحة باستخدام بيانات من فئات مختلفة بشكل متزامن وبطريقة seemlessly (سلسة). تظهر النتائج المبلغ عنها على أربع قواعد بيانات (MPII، Human3.6M، Penn Action و NTU) فعالية طريقتنا في المهام المستهدفة.请注意,"seamlessly" 一词在阿拉伯语中没有完全对应的词汇,因此我保留了英文并在其后加了注释(سلسة),以确保信息的完整性。