HyperAIHyperAI
منذ 11 أيام

تحسين تصنيف الأسئلة من خلال استخراج الميزات واختيارها

{Le Anh-Cuong, Nguyen Van-Tu}
الملخص

تصنيف الأسئلة هو المهمة التي تتمثل في التنبؤ بنوع الكيان الموجود في الجملة التي تُجيب على سؤال معين باللغة الطبيعية. يُعد هذا التصنيف مهمًا جدًا في العثور على إجابات دقيقة أو بناءها، وبالتالي يسهم في تحسين جودة أنظمة الإجابة الآلية على الأسئلة. في الدراسات السابقة، تم استخلاص ميزات لغوية وتركيبية ودلالية تلقائيًا من السؤال لخدمة عملية التصنيف. ومع ذلك، فإن دمج جميع هذه الميزات لا يضمن دائمًا تحقيق أفضل النتائج بالنسبة لأنواع مختلفة من الأسئلة. على عكس الدراسات السابقة، يركّز هذا البحث على مسألة كيفية استخراج وتحديد ميزات فعّالة تتكيف مع كل نوع مختلف من الأسئلة. نقترح أولًا طريقة تستخدم خوارزمية اختيار الميزات لتحديد الميزات المناسبة لكل نوع من أنواع الأسئلة. ثانيًا، نصمم نوعًا جديدًا من الميزات التي تعتمد على أنماط الأسئلة. وقد تم اختبار النهج المقترح على مجموعة بيانات معيارية (TREC) باستخدام خوارزمية آلات المتجهات الداعمة (SVM) لتصنيف الأسئلة. أظهرت النتائج تحسينًا ملحوظًا، حيث بلغت دقة التصنيف 95.2% في مجموعة البيانات ذات الحبكة العامة (coarse grain)، و91.6% في مجموعة البيانات ذات الحبكة الدقيقة (fine grain)، وهي نتائج أفضل بكثير مقارنة بالدراسات السابقة.

تحسين تصنيف الأسئلة من خلال استخراج الميزات واختيارها | أحدث الأوراق البحثية | HyperAI