منذ 2 أشهر
HDLTex: التعلم العميق الهرمي لتصنيف النصوص
Kamran Kowsari; Donald E. Brown; Mojtaba Heidarysafa; Kiana Jafari Meimandi; Matthew S. Gerber; Laura E. Barnes

الملخص
الزيادة المستمرة في عدد الوثائق التي تُنتَج كل عام تتطلب طرق معالجة معلومات متقدمة باستمرار للبحث والاسترجاع وتنظيم النص. وفي صميم هذه طرق معالجة المعلومات يأتي تصنيف الوثائق، الذي أصبح تطبيقًا مهمًا للتعلم الإشرافي. ومع زيادة عدد الوثائق مؤخرًا، تدهور أداء المصنفات التقليدية. وهذا يعود إلى أن الزيادة في عدد الوثائق جاءت مصحوبة بزيادة في عدد الفئات. يتناول هذا البحث المشكلة بطريقة مختلفة عن الطرق الحالية لتصنيف الوثائق التي تعتبر المشكلة كتصنيف متعدد الفئات. بدلاً من ذلك، نقوم بالتصنيف التراتبي باستخدام نهج نسميه "التعلم العميق التراتبي لتصنيف النصوص" (HDLTex). يستخدم HDLTex مكدسات من هياكل التعلم العميق لتوفير فهم متخصص على كل مستوى من مستويات الهرم الوثائقي.