شبكة الكبسولات الترميزية التكوينية مع توجيه K-Means لتصنيف النصوص

تصنيف النصوص هو مشكلة صعبة تهدف إلى تحديد فئة النصوص. خلال عملية التدريب، تحتل تمثيلات الكلمات (word embeddings) جزءًا كبيرًا من المعلمات. في ظل قيود الموارد الحاسوبية المحدودة، فإن هذا يحد بشكل غير مباشر من قدرة تصاميم الشبكات اللاحقة. من أجل تقليل عدد المعلمات، تم اقتراح آلية الترميز التركيبية مؤخرًا. بناءً على ذلك، تستكشف هذه الورقة البحثية الآلية التركيبية بشكل أعمق وتقدم طريقة ترميز تركيبية موزونة. ونقوم بتطبيق شبكة الكبسولات (capsule network) لنمذجة العلاقة بين تمثيلات الكلمات، حيث يتم اقتراح خوارزمية توجيه جديدة تعتمد على نظرية التجميع k-means لاستخراج العلاقة بين تمثيلات الكلمات بشكل كامل. بالجمع بين طريقة الترميز التركيبية الموزونة الخاصة بنا وخوارزمية التوجيه، نصمم شبكة عصبية للتصنيف النصي. أظهرت التجارب التي أجريت على ثماني مجموعات بيانات صعبة للتصنيف النصي أن الطريقة المقترحة تحقق دقة تنافسية مقارنة بأحدث الأساليب مع عدد أقل بكثير من المعلمات.