HyperAIHyperAI
منذ 2 أشهر

شبكة الهرم المتدرجة لتقدير وضعية الأشخاص المتعددين

Yilun Chen; Zhicheng Wang; Yuxiang Peng; Zhiqiang Zhang; Gang Yu; Jian Sun
شبكة الهرم المتدرجة لتقدير وضعية الأشخاص المتعددين
الملخص

تم تحسين موضوع تقدير وضعية الأشخاص المتعددين بشكل كبير مؤخرًا، خاصة مع تطور شبكات النيورونات التلافيفية. ومع ذلك، لا يزال هناك العديد من الحالات الصعبة التي لم يتم التعامل معها بشكل جيد، مثل النقاط الرئيسية المغطاة، النقاط الرئيسية غير المرئية والخلفيات المعقدة. في هذا البحث، نقدم بنية شبكة جديدة تسمى الشبكة الهرمية المتدرجة (Cascaded Pyramid Network - CPN) والتي تستهدف تخفيف المشكلة الناجمة عن هذه النقاط الرئيسية "الصعبة". وبشكل أكثر تحديدًا، يتضمن خوارزمياتنا مرحلتين: GlobalNet و RefineNet. GlobalNet هي شبكة هرمية للخصائص يمكنها تحديد مواقع النقاط الرئيسية "البسيطة" مثل العيون والأيدي بدقة ولكن قد تفشل في التعرف بدقة على النقاط الرئيسية المغطاة أو غير المرئية. أما RefineNet فتحاول التعامل صراحةً مع النقاط الرئيسية "الصعبة" من خلال دمج جميع مستويات تمثيل الخصائص من GlobalNet مع خسارة تعدين النقاط الرئيسية الصعبة عبر الإنترنت. عمومًا، لمعالجة مشكلة تقدير وضعية الأشخاص المتعددين، يتم اعتماد مسار رأسي-أسفل حيث يتم أولاً إنشاء مجموعة من الصناديق الحدودية للإنسان بناءً على كاشف، ثم استخدام CPN لدينا لتحديد موقع النقاط الرئيسية داخل كل صندوق حدودي للإنسان. استنادًا إلى الخوارزمية المقترحة، حققنا نتائج متقدمة على معيار نقاط المفتاح COCO، بمتوسط دقة يبلغ 73.0 على مجموعة بيانات اختبار COCO test-dev و 72.1 على مجموعة بيانات اختبار COCO test-challenge، مما يمثل تحسنًا نسبيًا بنسبة 19% مقارنة بـ 60.5 من تحدي نقاط المفتاح COCO 2016. الرمز (Code) (https://github.com/chenyilun95/tf-cpn.git) ونتائج الكشف متاحة علنًا للمزيد من الأبحاث.

شبكة الهرم المتدرجة لتقدير وضعية الأشخاص المتعددين | أحدث الأوراق البحثية | HyperAI