كُلّ ما تحتاجه هو عملية تقوية رسمية واحدة: تصنيف صور رمادية الكثافة بكفاءة

تنصّ على أن تصنيف الصور في المهام المحددة بالقطاع، مثل التعرف التلقائي على الأهداف باستخدام الرادار بفتحة مصغرة (SAR ATR) وتصنيف الأشعة السينية للصدر، يعتمد غالبًا على الشبكات العصبية التلافيفية (CNN). وعلى الرغم من قوة هذه الشبكات، فإنها تعاني من تأخير عالٍ ناتج عن عدد العمليات التي تقوم بها، وهو ما يمكن أن يشكل مشكلة في التطبيقات الزمنية الحقيقية. ورغم أن العديد من نماذج تصنيف الصور مصممة للعمل مع مجموعات بيانات ملونة (RGB) ورموز رمادية (Grayscale)، إلا أن تصنيف الصور الرمادية فقط يُعد أقل شيوعًا. ويُعد تصنيف الصور الرمادية له تطبيقات حاسمة في مجالات مثل التصوير الطبي وSAR ATR. وللرد على هذه الفجوة، نقدّم منهجية جديدة لتصنيف الصور الرمادية تعتمد على نظرة متجهية للصور. وباستغلال الطبيعة الخفيفة للشبكات العصبية متعددة الطبقات (MLPs)، نعامل الصور كمتجهات، مما يبسط المشكلة إلى تصنيف الصور الرمادية. ويتضمن منهجنا طبقة واحدة من الت convolution الرسومية (Graph Convolutional Layer) تعمل بطريقة مجمعة (Batch-wise)، مما يعزز الدقة ويقلل من التباين في الأداء. علاوةً على ذلك، قمنا بتطوير مسرّع مخصص على بيئة FPGA لنموذجنا، مع دمج عدة تحسينات لتعزيز الأداء. وتبين النتائج التجريبية على مجموعات بيانات معيارية للصور الرمادية فعالية منهجيتنا، حيث حققت تأخيرًا أقل بشكل كبير (حتى 16 مرة أقل على مجموعة MSTAR)، وأداءً تنافسيًا أو أفضل مقارنةً بالنماذج الرائدة في مجالات SAR ATR وتصنيف الصور الطبية.