SARATR-X: نحو بناء نموذج أساسي للتعرف على الأهداف في صور الرادار التزامني التداخل (SAR)

على الرغم من التقدم المذهل في التعرف التلقائي على الأهداف باستخدام الرادار ذات الفتحة المزروعة (SAR ATR)، فإن الجهود الحديثة ركزت بشكل أساسي على كشف وتصنيف فئة محددة من الأهداف، مثل المركبات أو السفن أو الطائرات أو المباني. واحدة من القيود الأساسية التي تواجه أفضل النماذج الحالية في مجال SAR ATR هي أن نموذج التعلم يعتمد على التعلم المراقب، ومتخصص في مهمة معينة، ومحدود بعدد الفئات، ويعمل ضمن بيئة مغلقة، وهو ما يتطلب كميات هائلة من العينات المُعلّمة بدقة، والتي يتم تسميتها بتكلفة عالية من قبل خبراء تحليل صور SAR، كما أن هذه النماذج تمتلك قدرة تعميم محدودة وقابلية توسع ضعيفة. في هذا العمل، نقوم لأول مرة ببناء نموذج أساسي (Foundation Model) لـ SAR ATR، يُسمى SARATR-X. يتعلم نموذج SARATR-X تمثيلات قابلة للتوسع من خلال التعلم ذاتي التوجيه (Self-Supervised Learning - SSL)، ويُعد حجر الأساس لتمكين التكيف الفعّال من حيث عدد العلامات في مهام كشف وتصنيف الأهداف في صور SAR العامة. وبشكل خاص، تم تدريب SARATR-X على 0.18 مليون عينة غير مُعلّمة من الأهداف في صور SAR، والتي تم جمعها من خلال دمج المعايير الحديثة، مُشكّلة بذلك أكبر مجموعة بيانات متاحة للجمهور حتى الآن. وبما أن صور SAR تمتلك خصائص فريدة، فقد تم تصميم هيكل أساسي (Backbone) مخصص خصيصًا لتطبيقات SAR ATR، كما تم تطبيق منهجية تعلم ذاتي مزدوجة الخطوات، تمتلك خصائص ميزات متعددة المقياس (Multi-scale Gradient Features)، لضمان تنوع الميزات وقابلية التوسع للنموذج. وقد تم تقييم قدرات SARATR-X في مهام التصنيف ضمن ظروف قليلة العينات (Few-shot) ومقاومة التغيرات (Robustness)، وكذلك في مهام الكشف عبر فئات ومشاهد متنوعة، حيث أظهر أداءً مبهرًا، غالبًا ما يكون مُنافسًا أو حتى متفوقًا على النماذج السابقة التي تعتمد على التعلم الكامل المراقب، أو شبه المراقب، أو ذاتي التوجيه. تم إصدار نموذج SARATR-X والبيانات المُجمعة على منصة GitHub عبر الرابط التالي: https://github.com/waterdisappear/SARATR-X، وذلك لتعزيز الأبحاث المتعلقة بالنماذج الأساسية لفهم صور SAR.