HyperAIHyperAI
منذ 17 أيام

InsPose: شبكات واعية بالهوية لتقدير وضعية الأشخاص متعددة في مرحلة واحدة

Dahu Shi, Xing Wei, Xiaodong Yu, Wenming Tan, Ye Ren, Shiliang Pu
InsPose: شبكات واعية بالهوية لتقدير وضعية الأشخاص متعددة في مرحلة واحدة
الملخص

يُعدّ تقدير وضعية الأشخاص متعددة الأشخاص مهمة جذابة وصعبة في الوقت نفسه. تعتمد الطرق الحالية في الغالب على إطار عمل ثنائي المراحل، والذي يشمل الطرق العلوية (top-down) والطرق السفلية (bottom-up). وتتعرض الطرق الثنائية المراحل إما لزيادة كبيرة في التكرار الحسابي بسبب الحاجة إلى كاشفات إضافية للأفراد، أو تتطلب تجميع المفاتيح (keypoints) بشكل تجريبي بعد توقع جميع المفاتيح غير المرتبطة بالمستخدم (instance-agnostic keypoints). يهدف النموذج الأحادي المراحل إلى تبسيط خط أنابيب تقدير وضعية الأشخاص متعددة الأشخاص، وقد لاقى اهتمامًا كبيرًا في الآونة الأخيرة. ومع ذلك، تواجه الطرق الأحادية المراحل قيودًا في الأداء المنخفض نظرًا لصعوبة استخلاص أشكال كاملة للجسم من متجه ميزة واحد. على عكس الحلول السابقة التي تتضمن تصميمات معقدة وتجريبية، نقدّم حلاً بسيطًا وفعالًا من خلال استخدام شبكات ديناميكية واعية بالكائن (instance-aware dynamic networks). بشكل محدد، نقترح وحدة واعية بالكائن (instance-aware module) تُعدّل بشكل تلقائي (جزءًا من) معاملات الشبكة لكل كائن على حدة. يمكن لهذا الحل أن يُعزز بشكل كبير من قدرة الشبكة ومواءمتها في التعرف على أنماط وضعية متنوعة، مع الحفاظ على بنية مدمجة قابلة للتدريب من البداية إلى النهاية. أظهرت التجارب الواسعة على مجموعة بيانات MS-COCO تحسنًا كبيرًا في الأداء مقارنة بالطرق الأحادية المراحل الحالية، كما حقق توازنًا أفضل بين الدقة والكفاءة مقارنة بالطرق الثنائية المراحل الرائدة. يُمكن الوصول إلى الشفرة والنماذج عبر الرابط: \url{https://github.com/hikvision-research/opera}.

InsPose: شبكات واعية بالهوية لتقدير وضعية الأشخاص متعددة في مرحلة واحدة | أحدث الأوراق البحثية | HyperAI