مصنف للعمليات الخطابية النصوص الفارسية وتطبيقاته في تحديد الشائعات

السلوكيات الخطابية (SAs) هي إحدى المجالات المهمة في علم البراغماتيكس، والتي تمنحنا فهماً أفضل لحالة العقل للأشخاص وتنقل وظيفة لغوية مقصودة. يمكن أن يكون معرفة سلوك الخطاب في نص ما مفيدة في تحليل هذا النص في تطبيقات معالجة اللغة الطبيعية. تقدم هذه الدراسة تقنية إحصائية تعتمد على القاموس لاكتشاف السلوكيات الخطابية الفارسية. تقوم التقنية المقترحة بتصنيف النص إلى سبع فئات من السلوكيات الخطابية بناءً على أربعة معايير: اصطلاحي، نحوِّي، دلالي، ومميزات السطح. تم استخدام WordNet كأداة لاستخراج الكلمات المرادفة وتثري قاموس الميزات. لتقييم التقنية المقترحة، استخدمنا أربع طرق تصنيف تتضمن غابة العشوائية (Random Forest - RF)، آلة المتجه الداعمة (Support Vector Machine - SVM)، نايف بايز (Naive Bayes - NB)، وجيران ك-الأقرب (K-Nearest Neighbors - KNN). أظهرت النتائج التجريبية أن الطريقة المقترحة باستخدام RF و SVM كأفضل تصنيفين حققت أداءً رائدًا بمعدل دقة 0.95 لتصنيف السلوكيات الخطابية الفارسية. رؤيتنا الأصلية لهذه العمل هي تقديم تطبيق لاكتشاف السلوك الخطابي على محتوى وسائل التواصل الاجتماعي، خاصة السلوك الخطابي الشائع في الشائعات. لذلك، تم استخدام النظام المقترح لتحديد السلوكيات الخطابية الشائعة في الشائعات. أظهرت النتائج أن الشائعات الفارسية غالباً ما يتم التعبير عنها في ثلاث فئات من السلوكيات الخطابية وهي: الرواية والسؤال والتهديد، وفي بعض الحالات مع سلوك الطلب.