تمثيل المستند الخاص بالوسم لتصنيف النص متعدد الوسوم

يهدف التصنيف النصي متعدد التصنيفات (MLTC) إلى تسمية أدق التصنيفات المناسبة للوثيقة المعطاة. في هذا البحث، نقترح شبكة انتباه محددة بالتصنيف (LSAN) لتعلم تمثيل وثيقة محدد بالتصنيف. تعتمد LSAN على معلومات الدلالة الخاصة بالتصنيفات لتحديد الارتباط الدلالي بين التصنيفات والوثيقة، بهدف بناء تمثيل وثيقة محدد بالتصنيف. وفي الوقت نفسه، تُستخدم آلية الانتباه الذاتي لاستخلاص تمثيل وثيقة محدد بالتصنيف من معلومات محتوى الوثيقة. ولضمان دمج سلس بين الجزأين المذكورين، تم اقتراح استراتيجية اندماج تكيفية، والتي يمكنها إخراج تمثيل وثيقة متكامل ومحدد بالتصنيف بكفاءة، مما يُمكّن من بناء تصنيف نصي متعدد التصنيفات. وقد أظهرت النتائج التجريبية الواسعة أن LSAN تتفوق باستمرار على الطرق الأحدث في المجال على أربع مجموعات بيانات مختلفة، وبشكل خاص في توقع التصنيفات منخفضة التكرار. تم إصدار الشفرة وضبط المعاملات الفائقة لتسهيل أبحاث الباحثين الآخرين.