التعلم الديناميكي للمرجعية للكشف عن الأشياء الموجهة بشكل عشوائي

الأشياء ذات التوجهات العشوائية تظهر بشكل واسع في المشاهد الطبيعية، والصور الجوية، والصور الحسية عن بعد، إلخ. ولذلك، حظي اكتشاف الأشياء ذات التوجهات العشوائية باهتمام كبير. يستخدم العديد من الكاشفات الدوارة الحالية الكثير من الأهداف (anchors) باتجاهات مختلفة لتحقيق التناسق المكاني مع الصناديق الحقيقية (ground truth boxes)، ثم يتم تطبيق تقدير التقاطع على الاتحاد (Intersection-over-Union - IoU) لاختيار المرشحين الإيجابيين والسالبين للتدريب. ومع ذلك، نلاحظ أن الأهداف الإيجابية المختارة لا يمكنها دائمًا ضمان الاكتشافات الدقيقة بعد الانحدار، بينما يمكن لبعض العينات السالبية تحقيق تحديد موقع دقيق. هذا يشير إلى أن تقييم جودة الأهداف عبر IoU غير مناسب، مما يؤدي إلى عدم تناسق بين ثقة التصنيف ودقة تحديد الموقع. في هذه الورقة البحثية، نقترح طريقة تعلم الأهداف الديناميكي (Dynamic Anchor Learning - DAL)، والتي تستفيد من درجة التطابق المعرفة حديثًا لتقييم إمكانات تحديد الموقع للأهداف بشكل شامل وإجراء عملية تعيين ملصقات أكثر كفاءة. بهذه الطريقة، يمكن للكاشف اختيار أهداف عالية الجودة ديناميكياً لتحقيق اكتشاف دقيق للأشياء، وسيتم تخفيف الانحراف بين التصنيف والانحدار. باستخدام DAL الجديد الذي تم تقديمه، نحقق أداءً اكتشافيًا متفوقًا للأجسام ذات التوجهات العشوائية باستخدام عدد قليل فقط من الأهداف المحددة أفقيًا. أظهرت النتائج التجريبية على ثلاث مجموعات بيانات للحسية عن بعد هي HRSC2016 وDOTA وUCAS-AOD بالإضافة إلى مجموعة بيانات نص المشاهد ICDAR 2015 أن طرقتنا حققت تحسينًا كبيرًا مقارنة بالنموذج الأساسي. علاوة على ذلك، فإن طرقتنا أيضًا عامة للاستخدام في اكتشاف الأجسام باستخدام الصندوق المحدد أفقيًا. الرمز والموديلات متاحة على https://github.com/ming71/DAL.