PhysAug: تكبير بيانات موجه بالفيزياء ويعتمد على التردد للكشف عن الكائنات العام في مجال واحد

يهدف الكشف عن الكائنات العام المتعدد النطاقات ذات المجال الواحد (S-DGOD) إلى تدريب نموذج على مجال مصدر واحد للحصول على أداء قوي عبر مجموعة متنوعة من المجالات الهدف غير المرئية، وذلك باستغلال كاشف كائنات. غالبًا ما تعتمد الطرق الحالية لـ S-DGOD على استراتيجيات تكبير البيانات، بما في ذلك تركيبة من التحولات البصرية، لتعزيز قدرة الكاشف على التعميم. ومع ذلك، فإن غياب المعرفة الواقعية السابقة يحد من قدرة تكبير البيانات على تعزيز تنوع توزيعات بيانات التدريب. لمعالجة هذه المشكلة، نقترح طريقة جديدة تُسمى PhysAug، وهي طريقة لتكبير البيانات تعتمد على نموذج فيزيائي يُستخدم في ظروف تصوير غير مثالية، بهدف تعزيز قابلية التكيف في مهام S-DGOD. مستندين إلى مبادئ البصريات الجوية، نطور نموذج اضطراب عام يُشكّل الأساس لطريقة PhysAug المقترحة. وبما أن الاضطرابات البصرية تنشأ عادةً من تفاعل الضوء مع الجسيمات الجوية، فإننا نستخدِم ط espectre الترددات البصرية لمحاكاة التغيرات الواقعية أثناء التدريب. يُسهم هذا النهج في تمكين الكاشف من تعلّم تمثيلات ثابتة بالنسبة للمجالات، مما يعزز قدرته على التعميم في مختلف البيئات. وبلا الحاجة إلى تغيير هيكل الشبكة أو دالة الخسارة، تتفوّق طريقتنا بشكل كبير على أفضل النماذج الحالية عبر مجموعة متنوعة من مجموعات بيانات S-DGOD. وتحديدًا، حققت تحسينًا ملحوظًا بنسبة 7.3% و7.2% مقارنةً بالأساس على مجموعتي بيانات DWD وCityscape-C، مما يُبرز تحسّنًا ملحوظًا في القدرة على التعميم في البيئات الواقعية.