HyperAIHyperAI
منذ 3 أشهر

DPNet: شبكة مسار مزدوج للكشف الفوري عن الكائنات باستخدام انتباه خفيف الوزن

Quan Zhou, Huimin Shi, Weikang Xiang, Bin Kang, Xiaofu Wu, Longin Jan Latecki
DPNet: شبكة مسار مزدوج للكشف الفوري عن الكائنات باستخدام انتباه خفيف الوزن
الملخص

شهدت التطورات الحديثة في ضغط الشبكات العصبية التلافيفية ذات الدقة العالية (CNNs) تقدماً ملحوظاً في مجال الكشف الفوري عن الكائنات. ولتسريع سرعة الكشف، تعتمد كاشفات خفيفة الوزن عادةً على عدد قليل من طبقات التلافيف باستخدام هيكل خلفي أحادي المسار. ومع ذلك، فإن البنية أحادية المسار تتضمن عمليات تجميع متكررة وتقليل الحجم، مما يؤدي إلى خرائط ميزات خشنة وغير دقيقة، وهو ما يُعد عائقاً في تحديد مواقع الكائنات. من ناحية أخرى، نظراً لقيود قدرة الشبكة، تكون الشبكات الخفيفة الوزن الحديثة أحياناً ضعيفة في تمثيل البيانات البصرية ذات الحجم الكبير. ولحل هذه المشكلات، تقدم هذه الورقة شبكة ثنائية المسار، تُسمى DPNet، مع خوارزمية انتباه خفيفة الوزن للكشف الفوري عن الكائنات. تتيح البنية الثنائية المسار لنا استخلاص السمات الدلالية عالية المستوى والتفاصيل الكائنية منخفضة المستوى بالتوازي. وعلى الرغم من أن DPNet تشبه تقريباً في الشكل الشبكات أحادية المسار، فإن التكاليف الحسابية وحجم النموذج لا تزداد بشكل ملحوظ. ولتعزيز قدرة التمثيل، تم تصميم وحدة ترابط ذاتية خفيفة الوزن (LSCM) لالتقاط التفاعلات العالمية، مع تكاليف حسابية وعدد محدود من المعلمات. وفي جزء "الرقبة"، تم توسيع LSCM إلى وحدة ترابط متقاطع خفيفة الوزن (LCCM)، والتي تلتقط الاعتماديات المتبادلة بين السمات على المقياس المجاورة. أجرينا تجارب مكثفة على مجموعتي بيانات MS COCO وPascal VOC 2007. وأظهرت النتائج التجريبية أن DPNet تحقق أفضل توازن حالياً بين دقة الكشف وكفاءة التنفيذ. وبشكل خاص، حققت DPNet دقة 30.5% AP على مجموعة اختبار MS COCO test-dev و81.5% mAP على مجموعة اختبار Pascal VOC 2007، مع حجم نموذج يقارب 2.5 مليون معلمة، و1.04 GFLOPs، و164 إطاراً في الثانية و196 إطاراً في الثانية لصور دخل بحجم 320×320 لكل من المجموعتين.

DPNet: شبكة مسار مزدوج للكشف الفوري عن الكائنات باستخدام انتباه خفيف الوزن | الأوراق البحثية | HyperAI