BN-AuthProf: تقييم الأداء في تعلم الآلة لتحديد ملف الشخصية المؤلف باللغة البنغالية على نصوص وسائل التواصل الاجتماعي

الملف الشخصي للكاتب، وهو تحليل النصوص لاكتشاف خصائص مثل جنس الكاتب وعمره، أصبح ضروريًا مع انتشار منصات التواصل الاجتماعي. يركز هذا البحث على الملف الشخصي للكاتب باللغة البنغالية، بهدف استخراج رؤى قيمة حول الكتاب المجهولين بناءً على أسلوب كتابتهم في وسائل التواصل الاجتماعي. الهدف الرئيسي هو تقديم وتقييم أداء نماذج التعلم الآلي على مجموعة بيانات جديدة لملف الشخصي البنغالي، وهي مجموعة BN-AuthProf. تتكون هذه المجموعة من 30,131 منشورًا على وسائل التواصل الاجتماعي لـ 300 كاتب، مصنفة حسب العمر والجنس. تم إخفاء هويات الكتاب والمعلومات الحساسة لضمان الخصوصية. تم استخدام تقنيات مختلفة من التعلم الآلي التقليدي والتعلم العميق لتقييم المجموعة. بالنسبة لتصنيف الجنس، حققت أفضل دقة بنسبة 80% باستخدام آلة المتجهات الداعمة (Support Vector Machine - SVM)، بينما حقق تصنيف بييز البسيط متعدد الحدود (Multinomial Naive Bayes - MNB) أفضل درجة F1 بمقدار 0.756. بالنسبة لتصنيف العمر، حقق MNB أعلى درجة دقة بلغت 91% مع درجة F1 بلغت 0.905. يسلط هذا البحث الضوء على فعالية التعلم الآلي في تصنيف الجنس والعمر لملف الشخصي البنغالي للكاتب، مع وجود تأثيرات عملية تشمل التسويق والأمن واللغويات الجنائية والتربية والتحقيقات الجنائية، مع مراعاة الخصوصية والتحيزات.