HyperAIHyperAI
il y a 11 jours

Approche à plusieurs vues pour suggérer des actions de modération sur les sites de questions-réponses communautaires

{Mohammadamin Fazli, Jafar Habibi, Issa Annamoradnejad}
Résumé

Face à la montée en flèche du nombre de nouvelles questions publiées chaque jour sur les principaux sites de questions-réponses, il devient impératif de développer des solutions logicielles automatisées et précises afin de remplacer la modération manuelle. Dans cet article, nous abordons les limites critiques de la modération par crowdsourcing au sein des communautés Q&A, et démontrons la faisabilité d’une automatisation de la modération grâce aux derniers modèles d’apprentissage automatique. Du point de vue technique, nous proposons une approche multi-vues qui génère trois groupes distincts de caractéristiques analysant une question sous trois angles différents : 1) des caractéristiques liées à la question, extraites à l’aide d’un modèle de régression basé sur BERT ; 2) des caractéristiques liées au contexte, extraites via un modèle de reconnaissance d’entités nommées ; et 3) des caractéristiques lexicales générales obtenues par des méthodes statistiques et analytiques. Ensuite, nous entraînons un classifieur basé sur le gradient boosting afin de prédire l’action de modération appropriée. À des fins d’évaluation, nous avons constitué un nouveau jeu de données comprenant 60 000 questions provenant de Stack Overflow, classées en trois catégories d’actions de modération. Sur la base d’une validation croisée sur ce jeu de données original, notre approche atteint une précision de 95,6 % dans un cadre de classification multi-classes, surpassant ainsi tous les modèles de pointe et les méthodes précédemment publiées. Nos résultats mettent clairement en évidence l’impact significatif des composants de génération de caractéristiques sur la performance globale du classifieur.

Approche à plusieurs vues pour suggérer des actions de modération sur les sites de questions-réponses communautaires | Articles de recherche récents | HyperAI