HyperAIHyperAI
منذ 2 أشهر

التحكم الانتباهي البكسلي لتصنيف البكسل بطريقة مقتضية

Shu Kong; Charless Fowlkes
التحكم الانتباهي البكسلي لتصنيف البكسل بطريقة مقتضية
الملخص

لتحقيق الاستدلال البخيل في مهام التسمية لكل بكسل مع ميزانية حسابية محدودة، نقترح وحدة \emph{التحكم الانتقائي البكسلية} (\emph{PAG}) التي تتعلم معالجة مجموعة منتقاة من المواقع الفضائية في كل طبقة من شبكة التعلم العميق المتكررة. تعتبر PAG آلية عامة، مستقلة عن الهيكل، غير مرتبطة بالمشكلة يمكن دمجها بسهولة في نموذج موجود مع ضبط دقيق. نستخدم PAG بطريقتين: 1) تعلم حقول التجميع المتغيرة فضائياً التي تحسن أداء النموذج دون زيادة التكلفة الحسابية المرتبطة بالتجميع متعدد المقاييس، و2) تعلم سياسة حسابية ديناميكية لكل بكسل لتقليل الحساب الكلي مع الحفاظ على الدقة.نقوم بتقييم PAG بشكل شامل على مجموعة متنوعة من مهام التسمية لكل بكسل، بما في ذلك تقسيم المعنى، اكتشاف الحدود، تقدير العمق الأحادي والتقدير الطبيعي للسطح. نوضح أن PAG يتيح الأداء التنافسي أو الرائد في هذه المهام. تظهر تجاربنا أن PAG يتعلم تخصيصاً فضائياً ديناميكياً للحسابات على الصورة الإدخالية مما يوفر أفضل نقاط توازن الأداء مقارنة بالطرق ذات الصلة (مثل قطع النماذج العميقة أو تخطي الطبقات بأكملها بشكل ديناميكي). عموماً، نلاحظ أن PAG يمكنه خفض الحساب بنسبة $10\%$ دون فقدان ملحوظ في الدقة والأداء يتدهور بطريقة سلسة عند فرض قيود حاسوبية أقوى.