HyperAIHyperAI
منذ 11 أيام

WSOD مع PSNet والانحدار الصناعي

Sheng Yi, Xi Li, Huimin Ma
WSOD مع PSNet والانحدار الصناعي
الملخص

يستخدم مهام الكشف عن الكائنات ذات التدريب الضعيف (WSOD) فقط التسميات على مستوى الصورة لتدريب نموذج الكشف عن الكائنات. وبما أن WSOD لا تتطلب تسميات على مستوى الكائنات التي تستهلك وقتًا طويلاً، فقد جذبت هذه المهمة اهتمامًا متزايدًا في الأبحاث. تعتمد الطرق السابقة في الكشف عن الكائنات ذات التدريب الضعيف على تحديثات تكرارية للكواشف والتسميات الافتراضية، أو استخدام طرق استبعاد القناع القائمة على الميزات. ومع ذلك، فإن معظم هذه الطرق لا تُنتج اقتراحات كاملة ودقيقة، بل غالبًا ما تُنتج فقط أجزاء الأكثر تمييزًا للكائن، أو تشمل كميات كبيرة من المناطق الخلفية. ولحل هذه المشكلة، أضفنا وحدة الانحدار للصناديق (box regression module) إلى شبكة الكشف عن الكائنات ذات التدريب الضعيف، واقترحنا شبكة تقييم الاقتراحات (PSNet) لضبط هذه الوحدة. تُعد وحدة الانحدار للصناديق مسؤولة عن تعديل الاقتراحات لتحسين معامل جوود (IoU) بين الاقتراحات والصورة الحقيقية (ground truth). بينما تقوم شبكة PSNet بتقييم الاقتراحات الناتجة من شبكة الانحدار للصناديق، واستخدام هذا التقييم لتحسين أداء وحدة الانحدار للصناديق. بالإضافة إلى ذلك، استخدمنا خوارزمية PRS لتحسين دقة التسميات الافتراضية الناتجة، مما يُسهم في تدريب وحدة الانحدار للصناديق بشكل أكثر فعالية. وباستخدام هذه الأساليب، تم تدريب الكاشف على مجموعتي بيانات PASCAL VOC 2007 و2012، وتم تحقيق نتائج محسّنة بشكل ملحوظ.

WSOD مع PSNet والانحدار الصناعي | أحدث الأوراق البحثية | HyperAI