HyperAIHyperAI
منذ 17 أيام

مخطط مُحسَّن لتقليل تعقيد التحويلات النقطية في الشبكات العصبية التلافيفية للتصنيف الصوتي، معتمد على مرشحات مجمعة متداخلة دون قيود القابلية للقسمة

{Domenec Puig, Hatem Rashwan, Mohamed Abdel-Nasser, Santiago Romani, Joao Paulo Schwarz Schuler}
الملخص

في تصنيف الصور باستخدام الشبكات العصبية التلافيفية العميقة (DCNNs)، يزداد عدد المعاملات في عمليات التلافيف النقطية بشكل سريع نتيجة لضرب عدد المرشحات بعدد قنوات الإدخال التي تأتي من الطبقة السابقة. أظهرت الدراسات السابقة أن شبكة فرعية قادرة على استبدال طبقات التلافيف النقطية بعدد معاملات أقل بكثير وعدد أقل من العمليات الحسابية العائمة، مع الحفاظ على القدرة على التعلم. في هذه الورقة، نقترح خطة مُحسَّنة لتقليل تعقيد التلافيف النقطية في DCNNs لتصنيف الصور، بناءً على استخدام مرشحات مجمعة متداخلة دون قيود قابلية القسمة. تعتمد الخطة المقترحة على استخدام التلافيف النقطية المجمعة، حيث تُعالج كل مجموعة جزءًا من قنوات الإدخال. ويتطلب هذا النموذج عدد قنوات لكل مجموعة كمعلمة فائقة (Ch). تحتوي الشبكة الفرعية للخطة المقترحة على طبقتين تلافيفيتين متتاليتين (K و L)، متصلتين بطبقة تداخلية في المنتصف، وتحسب مجموعتهما في النهاية. ويتم تحديد عدد مجموعات المرشحات وعدد المرشحات في كل مجموعة للطبقتين K و L من خلال قسمة دقيقة لعدد قنوات الإدخال الأصلي وعدد المرشحات على Ch. إذا لم تكن القسمة دقيقة، فلم يمكن استبدال الطبقة الأصلية. في هذه الورقة، نُحسّن الخوارزمية السابقة بحيث يتم تكرار قنوات الإدخال، وتُسمح للمجموعات بأن تحتوي على أعداد مختلفة من المرشحات، لمعالجة الحالات التي لا تكون فيها القسمة دقيقة. وبهذا، تقلل الخطة المقترحة عدد العمليات الحسابية العائمة بنسبة 11%، وعدد المعاملات القابلة للتدريب بنسبة 10% مقارنة بالطريقة السابقة. قمنا باختبار تحسيننا على معمارية EfficientNet-B0 كمبدأ مرجعي، وأجرينا اختبارات تصنيف على مجموعات بيانات CIFAR-10 وHistology للسرطان القولوني وMalaria. بالنسبة لكل مجموعة بيانات، حققت خطة التحسين لدينا وفرًا بنسبة 76% و89% و91% من عدد المعاملات القابلة للتدريب في EfficientNet-B0، مع الحفاظ على دقة التصنيف في الاختبارات.

مخطط مُحسَّن لتقليل تعقيد التحويلات النقطية في الشبكات العصبية التلافيفية للتصنيف الصوتي، معتمد على مرشحات مجمعة متداخلة دون قيود القابلية للقسمة | أحدث الأوراق البحثية | HyperAI