HyperAIHyperAI
منذ 17 أيام

الشبكات الديناميكية للمرشحات المنفصلة

Jingkai Zhou, Varun Jampani, Zhixiong Pi, Qiong Liu, Ming-Hsuan Yang
الشبكات الديناميكية للمرشحات المنفصلة
الملخص

الدالة التلافيفية (Convolution) تعد واحدة من الركائز الأساسية في هياكل الشبكات العصبية التلافيفية (CNN). وعلى الرغم من استخدامها الواسع، فإن الدالة التلافيفية القياسية تعاني من عيوب رئيسية: هي غير مُستندة إلى المحتوى (Content-agnostic) وتعتمد على حسابات مكثفة (Computation-heavy). أما المرشحات الديناميكية (Dynamic filters)، فهي مُستجيبة للمحتوى (content-adaptive)، لكنها تزيد من الحمل الحسابي بشكل إضافي. أما التلافيف العميق (Depth-wise convolution)، فهو نسخة خفيفة الوزن، لكنه غالبًا ما يؤدي إلى تراجع في أداء الشبكة العصبية التلافيفية، أو يتطلب عددًا أكبر من القنوات. في هذه الدراسة، نقترح طريقة تُسمى "المرشح الديناميكي المُفصَّل" (Decoupled Dynamic Filter - DDF)، التي تُعالج كلا العيوب بشكل متزامن. مستوحاة من التطورات الحديثة في مجال الانتباه (attention)، تقوم DDF بفصل المرشح الديناميكي العميق إلى مرشحين ديناميكين: واحد للمساحة (spatial) وآخر للقناة (channel). يؤدي هذا التجزئة إلى تقليل كبير في عدد المعاملات، ويُحد من التكاليف الحسابية على نفس المستوى المُوازي للتلافيف العميق. في الوقت نفسه، لاحظنا تحسنًا ملحوظًا في الأداء عند استبدال الدالة التلافيفية القياسية بـ DDF في الشبكات التصنيفية. فتحسّنت دقة التصنيف الرفيعة (Top-1 accuracy) لشبكتي ResNet50 وResNet101 بنسبة 1.9% و1.3% على التوالي، مع تقليل التكاليف الحسابية إلى حد ما يقارب النصف. كما أظهرت التجارب على شبكات الكشف (detection) والترقية المتزامنة (joint upsampling) أداءً متفوقًا لنموذج الترقية المُستند إلى DDF (DDF-Up) مقارنة بالدالة التلافيفية القياسية والطبقات المتخصصة المُستجيبة للمحتوى.

الشبكات الديناميكية للمرشحات المنفصلة | أحدث الأوراق البحثية | HyperAI