HyperAIHyperAI
منذ 17 أيام

شبكة كابسول فعالة محسّنة لتصنيف مجموعة بيانات معيار Kuzushiji-MNIST

{Jarosław Kurek, Izabella Antoniuk, Michał Bukowski}
الملخص

في هذه الورقة، نقدم نموذجًا مُحسَّنًا وفعالًا للشبكة الكبسولية (CN) لتصنيف مجموعتي البيانات المرجعيتين Kuzushiji-MNIST وKuzushiji-49. تمثل الشبكات الكبسولية نهجًا واعدًا في مجال التعلم العميق، حيث تتميز بمزايا مثل المقاومة، والقدرة على التعميم الأفضل، وهيكل شبكة أبسط مقارنة بالشبكات العصبية التلافيفية التقليدية (CNNs). ويُبنى النموذج المقترح على هيكل Efficient CapsNet، مع دمج آلية التوجيه ذات الانتباه الذاتي (self-attention routing)، مما يؤدي إلى تحسين الكفاءة وتقليل عدد المعاملات. أظهرت التجارب التي أُجريت على مجموعتي بيانات Kuzushiji-MNIST وKuzushiji-49 أن النموذج يحقق أداءً تنافسيًا، ويحتل مكانة ضمن أفضل عشرة حلول في كلا المجموعتين. وبالرغم من استخدامه لعدد أقل بكثير من المعاملات مقارنة بالمنافسين ذوي التصنيفات الأعلى، إلا أنه يحقق دقة مماثلة، حيث بلغ الفرق الإجمالي في الدقة 0.91% و1.97% على التوالي لبيانات Kuzushiji-MNIST وKuzushiji-49. علاوة على ذلك، تم تقليل زمن التدريب بشكل كبير، مما يمكّن من تدريب النموذج على محطات عمل غير متخصصة. تساهم الابتكارات المُقدمة في بنية الكبسولات، بما في ذلك دمج آلية الانتباه الذاتي والهيكل الشبكي الفعّال، في تحسين كفاءة وفعالية النموذج المقدم. تُبرز هذه النتائج الإمكانات الكبيرة للشبكات الكبسولية كنهج أكثر كفاءة وفعالية في مهام تصنيف الرموز، مع تطبيقات أوسع في مجالات مختلفة.