من الفوضى تأتي النظام: ترتيب تمثيلات الحدث للتمييز عن الكائنات والكشف عنها

اليوم، تُحوّل الشبكات العصبية العميقة المتطورة التي تُعالج الأحداث أولاً إلى تمثيلات إدخال كثيفة على شكل شبكة منتظمة قبل استخدام شبكة جاهزة. ومع ذلك، يتطلب اختيار التمثيل المناسب للمهمة تقليديًا تدريب شبكة عصبية لكل تمثيل، ثم اختيار الأفضل بناءً على درجة التحقق، وهي عملية تستهلك وقتًا كبيرًا. تُزيل هذه الدراسة هذه العقبة من خلال اختيار التمثيلات بناءً على انحراف جروموفر-واسرستاين (GWD) بين الأحداث الخام وتمثيلاتها. ويُعد حساب هذا الانحراف أسرع بحوالي 200 مرة مقارنةً بتدريب شبكة عصبية، مع الحفاظ على ترتيب أداء التمثيلات في المهام عبر تمثيلات متعددة، وبنية شبكات مختلفة، ومستودعات بيانات متنوعة، ومهمات متعددة. وبالتالي، يصبح إيجاد تمثيلات ذات درجات عالية في المهمة مكافئًا لاختيار تمثيلات ذات انحراف GWD منخفض. نستخدم هذه الرؤية لأول مرة لإجراء بحث حول المعلمات الفائقة على عائلة واسعة من تمثيلات الأحداث، مما كشف عن تمثيلات جديدة وقوية تفوق الحد الأقصى الحالي للتقنيات. تتفوق التمثيلات المُحسَّنة لدينا على التمثيلات الحالية بنسبة 1.7 نقطة في mAP على مجموعة بيانات 1 Mpx و0.3 نقطة في mAP على مجموعة بيانات Gen1، وهما معياران متعارف عليهما للكشف عن الكائنات، وتحقق أيضًا تحسنًا بنسبة 3.8% في دقة التصنيف على معيار mini N-ImageNet. علاوةً على ذلك، نتفوق على أحدث التقنيات بنسبة 2.1 نقطة في mAP على Gen1، وعلى الطرق المُقَدَّمة مسبقًا بنسبة 6.0 نقاط في mAP على مجموعة بيانات 1 Mpx. تفتح هذه الدراسة مجالًا جديدًا لم يُستكشف سابقًا، يتمثل في تحسين التمثيلات بشكل صريح لتعلم الأحداث القائمة على الأحداث.