HyperAIHyperAI
منذ 17 أيام

15 نقطة أساسية كل ما تحتاجه

Michael Snower, Asim Kadav, Farley Lai, Hans Peter Graf
15 نقطة أساسية كل ما تحتاجه
الملخص

تُعد متابعة الوضعية البشرية مشكلة مهمة تتطلب تحديد حالات وضعية إنسانية فريدة وربطها زمنيًا عبر الإطارات المختلفة في مقطع فيديو. ومع ذلك، فإن الطرق الحالية لمتابعة الوضعية لا تتمكن من نمذجة العلاقات الزمنية بدقة، وتحتاج إلى حسابات كبيرة، غالبًا ما تُجرى هذه العمليات خارج الوقت الحقيقي (أوفلاين). نقدّم طريقة فعّالة لاستمرار تتبع الوضعية البشرية متعددة الأشخاص، تُسمّى KeyTrack، والتي تعتمد فقط على معلومات النقاط المفتاحية دون استخدام أي معلومات بصريّة (RGB) أو تدفقات بصرية (optical flow)، لتتبع نقاط الوضعية البشرية في الوقت الفعلي. يتم تتبع النقاط باستخدام طريقة "الاستخلاص الوضعوي" (Pose Entailment)، حيث يتم أولاً أخذ زوج من تقديرات الوضعية من إطارات مختلفة في الفيديو، ثم تحويلها إلى تمثيلات رمزية (tokenized). بعد ذلك، يقوم شبكة قائمة على المُحَوِّل (Transformer) بتصنيف ثنائي لتحديد ما إذا كانت حالة وضعية ما تتبع زمنيًا حالة أخرى. بالإضافة إلى ذلك، قمنا بتحسين طريقة التقدير العلوي للوضعية باستخدام تقنية جديدة وغير مُعَدَّة بمعاملات (parameter-free) لتحسين نقاط الوضعية، مما يُحسّن دقة التقديرات المستخدمة في خطوة "الاستخلاص الوضعوي". وقد حققنا نتائج من الدرجة الأولى (state-of-the-art) على معايير PoseTrack'17 وPoseTrack'18، مع استخدام جزء ضئيل جدًا من الحوسبة مقارنةً بالطرق الأخرى في حساب معلومات المتابعة.

15 نقطة أساسية كل ما تحتاجه | أحدث الأوراق البحثية | HyperAI