HyperAIHyperAI
منذ 9 أيام

MUXConv: تعدد المعلومات في الشبكات العصبية التلافيفية

Zhichao Lu, Kalyanmoy Deb, Vishnu Naresh Boddeti
MUXConv: تعدد المعلومات في الشبكات العصبية التلافيفية
الملخص

لقد شهدت الشبكات العصبية التلافيفية تحسينات ملحوظة في الكفاءة الحسابية في السنوات الأخيرة. وقد كان أحد الدوافع الرئيسية هو فكرة التضحية بقدرة النموذج على التعبير (model expressivity) مقابل الكفاءة، من خلال الجمع بين التلافيف $1\times 1$ والتلافيف المنفصلة العميقة (depth-wise separable convolutions) بدلًا من الطبقة التلافيفية القياسية. ومع ذلك، فإن سعر هذه الكفاءة هو التدفق غير الأمثل للمعلومات عبر الفضاء والقنوات داخل الشبكة. ولsuperar هذه القيود، نقدّم MUXConv، وهي طبقة صُممت لتعزيز تدفق المعلومات من خلال تجميع تدفق المعلومات القنواتية والمكانية بشكل تدريجي في الشبكة، مع تقليل التعقيد الحسابي. علاوةً على ذلك، لبيان فعالية MUXConv، قمنا بدمجها ضمن خوارزمية تطورية متعددة الأهداف فعّالة للبحث عن القيم المثلى للبارامترات النموذجية، مع تحسين الدقة والانكماش (compactness) والكفاءة الحسابية في آنٍ واحد. على مجموعة بيانات ImageNet، حققت النماذج الناتجة، والتي أطلق عليها اسم MUXNets، أداءً مماثلاً (دقة 75.3% في التصنيف الأولي) وعدد عمليات الضرب والجمع (218M) مثل MobileNetV3، مع أن تكون أكثر انكماشًا بنسبة 1.6 مرة، وتفوق جميع النماذج المتنقلة الأخرى في جميع المعايير الثلاثة. كما أظهرت MUXNet أداءً جيدًا في التعلم المن転 (transfer learning) وفي التكيّف لمهام كشف الكائنات. وعلى معيار ChestX-Ray 14، بلغت دقتها مستوى يتنافس مع الأفضل في المجال، مع أن تكون أكثر انكماشًا بنسبة 3.3 مرة وأكثر كفاءة بنسبة 14 مرة. وبالمثل، حققت كشفًا على PASCAL VOC 2007 بدقة أعلى بنسبة 1.2%، وأسرع بنسبة 28%، وأكثر انكماشًا بنسبة 6% مقارنةً بـ MobileNetV2. يمكن الوصول إلى الكود من خلال: https://github.com/human-analysis/MUXConv