شبكات عصبية متعددة الطبقات فعّالة على راببي باي لتصنيف الصور

بفضل الأداء المتميز للخوارزميات القائمة على التعلم العميق في مجال الرؤية الحاسوبية (CV)، أصبحت بنية الشبكة العصبية التلافيفية (CNN) العمود الفقري الرئيسي للمهام المتعلقة بالرؤية الحاسوبية. ومع الانتشار الواسع للأجهزة المحمولة، بدأت النماذج الشبكية العصبية القائمة على منصات ذات قدرة حوسبة منخفضة بالحصول على اهتمام متزايد. ومع ذلك، نظرًا للقيود المفروضة على القدرة الحاسوبية، فإن خوارزميات التعلم العميق غالبًا ما تكون غير متاحة على الأجهزة المحمولة. تُقدّم هذه الورقة شبكة عصبية تلافيفية خفيفة الوزن تُسمى TripleNet، التي يمكنها العمل بسلاسة على جهاز راسبيري باي. مستوحاة من مفهوم الاتصالات الكتلية في ThreshNet، فإن النموذج الشبكي الجديد يُقلّل من حجم الشبكة ويعزّز سرعتها، ويقلّل من عدد المعاملات في الشبكة، ويُقلّل من زمن الاستنتاج لكل صورة مع الحفاظ على الدقة. أجرِيت تجارب تصنيف الصور باستخدام TripleNet ونماذج الشبكات العصبية الأحدث (SOTA) على منصّة راسبيري باي باستخدام مجموعتي بيانات CIFAR-10 وSVHN. أظهرت النتائج التجريبية أن زمن الاستنتاج لكل صورة في TripleNet يقل بنسبة 15% و16% و17% و24% و30% مقارنةً بـ GhostNet وMobileNet وThreshNet وEfficientNet وHarDNet على التوالي. يمكن الاطلاع على الشيفرة التفصيلية لهذا العمل من خلال الرابط التالي: https://github.com/RuiyangJu/TripleNet.