HyperAIHyperAI
منذ 17 أيام

شبكة هرمية لاستخراج الميزات ذات تكامل مزدوج متوازٍ ومتغيرات متعددة للكشف الدقيق عن الكائنات في عملية واحدة

Ping-Yang Chen, Ming-Ching Chang, Jun-Wei Hsieh, Yong-Sheng Chen
شبكة هرمية لاستخراج الميزات ذات تكامل مزدوج متوازٍ ومتغيرات متعددة للكشف الدقيق عن الكائنات في عملية واحدة
الملخص

يُقدّم هذا البحث شبكة الهرم المميزات المتوازية ذات التكامل الثنائي للبقايا (PRB-FPN) للكشف السريع والدقيق عن الكائنات في صورة واحدة. تُستخدم هرميات الميزات (FP) على نطاق واسع في الكشف البصري الحديث، ومع ذلك فإن المسار العلوي-السفلي (top-down pathway) في هرميات الميزات لا يمكنه الحفاظ على التحديد الدقيق للموقع بسبب انزياح التجميع (pooling shifting). وتتضاءل الميزة الأساسية لهرميات الميزات مع استخدام خلفيات أعمق ذات عدد أكبر من الطبقات. علاوةً على ذلك، لا يمكنها الحفاظ على دقة الكشف عن الكائنات الصغيرة والكبيرة في الوقت نفسه. ولحل هذه المشكلات، نقترح بنية جديدة لهرميات الميزات متوازية مع تكامل ثنائي الاتجاه (عَلوي-سفلي وسفلي-عَلوي)، بالإضافة إلى تحسينات مصاحبة لحفظ ميزات عالية الجودة لضمان تحديد دقيق للموقع. ونقدم التحسينات التالية في التصميم: (1) بنية هرمية متوازية ذات تكامل ثنائي (bifusion) مع وحدة تكامل سفلي (BFM) تسمح بالكشف عن الكائنات الصغيرة والكبيرة في نفس الوقت بدقة عالية. (2) وحدة التجميع وإعادة التنظيم (CORE) توفر مسارًا سفليًا لدمج الميزات، مما يؤدي إلى هرمية ميزات ذات تكامل ثنائي الاتجاه، قادرة على استرجاع المعلومات المفقودة من خرائط الميزات ذات الطبقات المنخفضة. (3) يتم تصفية ميزات CORE بشكل إضافي لحفظ معلومات سياقية أكثر غنىً. ويمكن إتمام هذه التصفية في مسارين علوي وسفلي خلال عدد قليل من التكرارات. (4) إضافة تصميم متبقي (residual) إلى وحدة CORE تؤدي إلى وحدة جديدة تُسمى Re-CORE، التي تُمكّن من التدريب السهل ودمجها مع مجموعة واسعة من الخلفيات العميقة أو الخفيفة. تحقق الشبكة المقترحة أداءً من الطراز الرائد على مجموعتي البيانات UAVDT17 وMS COCO. يمكن الوصول إلى الكود من خلال الرابط التالي: https://github.com/pingyang1117/PRBNet_PyTorch.

شبكة هرمية لاستخراج الميزات ذات تكامل مزدوج متوازٍ ومتغيرات متعددة للكشف الدقيق عن الكائنات في عملية واحدة | أحدث الأوراق البحثية | HyperAI