CASSOD-Net: الهياكل المتسلسلة والمنفصلة للانعكاس المُوسّع لتطبيقات ونُظم الرؤية المدمجة

يُعد مجال الرؤية (FOV) للشبكات العصبية التلافيفية مرتبطًا بشكل وثيق بدقة الاستنتاج. وتشتهر التلافيف الممتدة (Dilated Convolutions) بأنها حل فعّال للقضايا التي تتطلب مجالات رؤية كبيرة. ومع ذلك، فإن معالجة التلافيف الممتدة تستغرق عادةً وقتًا إضافيًا مقارنة بالتفعيلات القياسية، سواء على الأجهزة العامة أو الأجهزة المخصصة. في هذا البحث، نقترح وحدة شبكة تُسمى "بنية متسلسلة وقابلة للانفصال للتلافيف الممتدة" (CASSOD)، بالإضافة إلى نظام هاردوير خاص لمعالجة شبكات CASSOD بكفاءة. تتضمن شبكة CASSOD-Net عدة مرشحات ممتدة بحجم $2 \times 2$ مرتبة بشكل متسلسل، والتي يمكن استخدامها بديلًا عن المرشحات الممتدة التقليدية بحجم $3 \times 3$ دون تقليل دقة الاستنتاج. تم اختبار حالتين تطبيقيتين كأمثلة: كشف الوجه والتقسيم الصوري، باستخدام التلافيف الممتدة والوحدات المقترحة CASSOD. وحققت الشبكة الجديدة للكشف عن الوجه دقة أعلى مقارنة بالعمل السابق، مع استخدام فقط 47% من أوزان المرشحات في طبقات التلافيف الممتدة ضمن وحدة السياق. علاوةً على ذلك، يمكن للنظام المُقترح من الأجهزة تسريع عمليات التلافيف الممتدة، حيث يُعد أسرع بنسبة 2.78 مرة مقارنة بأنظمة الأجهزة التقليدية عند استخدام حجم مرشح $3 \times 3$.