HyperAIHyperAI
منذ 12 أيام

تُحصّل ما تزرع: استخدام الفيديوهات لتكوين اقتراحات كائنية عالية الدقة للكشف عن الكائنات المُراقب بشكل ضعيف

{ Yong Jae Lee, Krishna Kumar Singh}
تُحصّل ما تزرع: استخدام الفيديوهات لتكوين اقتراحات كائنية عالية الدقة للكشف عن الكائنات المُراقب بشكل ضعيف
الملخص

نُقدّم طريقة جديدة لاستخدام مقاطع الفيديو لاستخلاص اقتراحات كائنات عالية الدقة للكشف عن الكائنات المُدرَّب ضعيفًا. تُستخدم الطرق الحالية للكشف المُدرَّب ضعيفًا أساليب اقتراح جاهزة مثل "Edge Boxes" أو "Selective Search" للحصول على صناديق مرشحة. تُقدّم هذه الأساليب معدل استرجاع عالٍ، ولكن بثمن آلاف الاقتراحات الضوضائية. وبالتالي، يقع على عاتق خطوة استخراج الكائنات اللاحقة كامل العبء المتعلق بالعثور على المناطق الكائنية ذات الصلة القليلة. لمعالجة هذه المشكلة، نركّز بدلًا من ذلك على تحسين دقة الاقتراحات الأولية للكائنات. وبما أننا لا يمكننا الاعتماد على تسميات الموضع، نلجأ إلى استخدام مقاطع الفيديو واستغلال مؤشرات الحركة لتقييم تلقائي لامتداد الكائنات، بهدف تدريب شبكة اقتراح مناطق مُدرَّبة ضعيفًا (W-RPN). نستخدم W-RPN لإنتاج اقتراحات كائنات عالية الدقة، والتي تُستخدم بدورها لإعادة ترتيب الاقتراحات ذات المعدل العالي من الاسترجاع، مثل Edge Boxes أو Selective Search، بناءً على تداخلها المكاني. تؤدي اقتراحات W-RPN إلى تحسين ملحوظ في الأداء بالنسبة لأفضل الطرق الحالية للكشف عن الكائنات المُدرَّب ضعيفًا على مجموعتي بيانات PASCAL VOC 2007 و2012.

تُحصّل ما تزرع: استخدام الفيديوهات لتكوين اقتراحات كائنية عالية الدقة للكشف عن الكائنات المُراقب بشكل ضعيف | أحدث الأوراق البحثية | HyperAI