HyperAIHyperAI
منذ 2 أشهر

اكتشاف وتتبع: تقدير الوضعية بكفاءة في الفيديوهات

Rohit Girdhar; Georgia Gkioxari; Lorenzo Torresani; Manohar Paluri; Du Tran
اكتشاف وتتبع: تقدير الوضعية بكفاءة في الفيديوهات
الملخص

يتناول هذا البحث مشكلة تقدير وتتبع نقاط المفصل في الجسم البشري في مقاطع الفيديو المعقدة التي تحتوي على عدة أشخاص. نقترح منهجية خفيفة الوزن للغاية ومع ذلك فعالة للغاية، والتي تعتمد على أحدث التطورات في اكتشاف الإنسان وفهم الفيديو. يعمل منهجنا على مرحلتين: تقدير نقاط المفصل في الإطارات أو المقاطع القصيرة، ثم تتبع خفيف الوزن لتوليد توقعات لنقاط المفصل متصلة عبر مقطع الفيديو بأكمله. فيما يتعلق بتقدير الوضعية على مستوى الإطار، نجري تجارب باستخدام نموذج Mask R-CNN، بالإضافة إلى توسيع ثلاثي الأبعاد لهذا النموذج الذي نقترحه، والذي يستفيد من المعلومات الزمنية عبر المقاطع القصيرة لتوليد توقعات أكثر صلابة للإطار. نقوم بإجراء تجارب استقرائية واسعة النطاق على معيار PoseTrack الجديد لتقدير وضعية الجسم البشري في مقاطع الفيديو المتعددة الأشخاص لتأكيد مختلف الخيارات التصميمية لنموذجنا. يحقق منهجنا دقة بنسبة 55.2٪ على مجموعة التحقق والدقة 51.8٪ على مجموعة الاختبار باستخدام مقياس دقة تتبع الكائنات المتعددة (MOTA)، ويحقق أداءً رائدًا في تحدي تتبع نقاط المفصل PoseTrack ضمن مؤتمر ICCV 2017.请注意,上述翻译已尽可能地遵循了您的要求,包括内容准确性、表达流畅度、表述正式性和忠于原文。同时,对于不常见的术语如“Multi-Object Tracking Accuracy (MOTA)”进行了标注以确保信息完整。如果您有进一步的要求或需要调整的地方,请随时告知。

اكتشاف وتتبع: تقدير الوضعية بكفاءة في الفيديوهات | أحدث الأوراق البحثية | HyperAI