HyperAIHyperAI
منذ 2 أشهر

تحسين تدريب الشبكات الثنائية لتقدير وضعية الإنسان وتمييز الصور

Adrian Bulat; Georgios Tzimiropoulos; Jean Kossaifi; Maja Pantic
تحسين تدريب الشبكات الثنائية لتقدير وضعية الإنسان وتمييز الصور
الملخص

الشبكات العصبية الكبيرة التي تم تدريبها على مجموعات بيانات كبيرة قد أحدثت تقدماً كبيراً في مجال مجموعة واسعة من المشكلات الصعبة، مما أدى إلى تحسين الأداء بشكل كبير. ومع ذلك، تحت قيود الذاكرة المنخفضة والقدرة الحسابية المحدودة، تنخفض الدقة في نفس المشكلات بشكل كبير. في هذا البحث، نقترح سلسلة من التقنيات التي تحسن بشكل كبير دقة الشبكات العصبية الثنائية (أي الشبكات حيث تكون الخصائص والأوزان ثنائية). نقيم التحسينات المقترحة على مهمتين مختلفتين: التعرف الدقيق (تقدير وضع الإنسان) والتعرف على الصور على نطاق واسع (تصنيف ImageNet). بوجه خاص، نقدم سلسلة من التغييرات المنهجية الجديدة والتي تشمل: (أ) وظائف تنشيط أكثر ملاءمة، (ب) التهيئة بالترتيب العكسي، (ج) التكميم التدريجي، و(د) تراكيب الشبكات. ونوضح أن هذه الإضافات تحسن تقنيات ثنائية الشبكات العصبية الحالية بشكل كبير. بالإضافة إلى ذلك، وللمرة الأولى، ندرس مدى إمكانية الجمع بين ثنائية الشبكات العصبية وتقطير المعرفة. عند اختبار طريقتنا على مجموعة البيانات الصعبة MPII، أظهرت طريقتنا تحسيناً في الأداء بنسبة أكثر من 4% بمقياس مطلق. وأخيراً، نؤكد صحة نتائجنا بتطبيق التقنيات المقترحة للتعرف على الأشياء على نطاق واسع باستخدام مجموعة بيانات Imagenet، حيث نبلغ عن خفض معدل الخطأ بنسبة 4%.