HyperAIHyperAI
منذ 12 أيام

كشف الكائنات الصغيرة للطيور باستخدام مُحَوِّل سوين

{Ichiro Ide, Takahiro Komamizu, Takatsugu Hirayama, Yasutomo Kawanishi, TingWei Liu, Marc A. Kastner, Da Huo}
الملخص

كشف الكائنات هو المهمة التي تتمثل في اكتشاف الكائنات داخل صورة. وفي هذه المهمة، يُعد اكتشاف الكائنات الصغيرة أمرًا بالغ الصعوبة. إلى جانب حجمها الصغير، تُرافق هذه الكائنات صعوبات أخرى مثل الضبابية والاختباء (الإغلاق)، وغيرها. وتُعد الطرق الحالية للكشف عن الكائنات الصغيرة مصممة خصيصًا للسياقات التي تكون فيها الكائنات صغيرة ومتقاربة، مثل المشاة في الحشود أو الكائنات البعيدة في سيناريوهات الاستشعار عن بعد. ومع ذلك، عندما تكون الكائنات المستهدفة صغيرة ونادرة، فإن عدد الكائنات المتاحة للتدريب يكون محدودًا، مما يُصعّب تعلّم ميزات فعّالة. في هذه الورقة، نقترح طريقة مخصصة للكشف عن فئة معينة من الكائنات الصغيرة؛ وهي الطيور. وبشكل خاص، نُحسّن الميزات التي يتعلمها "الرقبة" (الشبكة الفرعية بين المُسنّد الأساسي والرأس التنبؤي)، من خلال تصميم هرمي يُمكّن من تعلّم ميزات أكثر فعالية. ونستخدم نموذج Swin Transformer لرفع دقة ميزات الصورة. بالإضافة إلى ذلك، نُعدّل حجم النوافذ المنزَحَة لتكييفها مع الكائنات الصغيرة. تُظهر التجارب أن دمج "الرقبة" المستندة إلى Swin Transformer مع CenterNet يؤدي إلى أداء جيد عند تعديل أحجام النوافذ. ونكتشف أيضًا أن أحجام النوافذ الأصغر (الافتراضية 2) تُسهم في تحسين مؤشر mAP للكشف عن الكائنات الصغيرة.