التنبؤ بالسمات الذاتية للأسئلة في مواقع الأسئلة والأجوبة باستخدام BERT

تتوقع مواقع الإجابة على الأسئلة المجتمعية، مثل StackOverflow وQuora، من المستخدمين الالتزام بتعليمات محددة للحفاظ على جودة المحتوى. تعتمد هذه الأنظمة بشكل رئيسي على تقارير المجتمع لتقييم المحتوى، وهي تواجه مشكلات جسيمة مثل البطء في التعامل مع المخالفات، وفقدان وقت المستخدمين العاديين والمحترفين، وانخفاض جودة بعض التقارير، وتشجيع التغذية الراجعة السلبية تجاه المستخدمين الجدد. ولهذا السبب، وبهدف عام هو تقديم حلول لآلية تنظيم المحتوى تلقائيًا في مواقع الأسئلة والأجوبة، نهدف إلى تطوير نموذج قادر على التنبؤ بـ 20 جوانب جودة أو موضوعية للأسئلة في مواقع الأسئلة والأجوبة. ولتحقيق ذلك، استخدمنا بيانات جمعها فريق CrowdSource في مختبرات Google Research في عام 2019، ونُفّذنا تدريبًا دقيقًا (fine-tuning) لنموذج BERT مُدرّب مسبقًا على مشكلتنا. ووفقًا لتقييم الأداء باستخدام متوسط مربع الخطأ (MSE)، حقق النموذج قيمة قدرها 0.046 بعد تدريبه لـ 2 دورات، دون تحسن ملحوظ في الدورات اللاحقة. وتؤكد النتائج أن التدريب الدقيق البسيط يمكن أن يؤدي إلى نماذج دقيقة في وقت قصير وبكميات محدودة من البيانات.