Impliquer le public : génération de questions de sondage pour les publications sur les réseaux sociaux

Cet article présente une nouvelle tâche visant à générer des questions de sondage pour les publications sur les réseaux sociaux. Elle offre une méthode simple pour capter les opinions du public et comprendre leurs ressentis face à des enjeux sociaux importants. Alors que la plupart des travaux connexes se concentrent sur des langages formels (par exemple, des sujets d’examen), nous nous penchons sur la génération de questions de sondage pour des messages courts et informels publiés sur les réseaux sociaux, caractérisés par une forte rareté des données. Pour surmonter ce défi, nous proposons d’encoder les commentaires des utilisateurs et de découvrir des sujets latents au sein de ces commentaires afin d’en faire des contextes. Ces contextes sont ensuite intégrés dans une architecture séquence-à-séquence (S2S) étendue avec deux décodeurs, permettant non seulement de générer des questions, mais aussi de produire simultanément les choix de réponse (réponses) du sondage. Pour les expérimentations, nous avons collecté un grand jeu de données chinois issu de Sina Weibo, comprenant plus de 20 000 sondages. Les résultats montrent que notre modèle surpasse les modèles S2S populaires qui n’exploitent pas les sujets extraits des commentaires, et que l’architecture à deux décodeurs améliore davantage la prédiction à la fois des questions et des réponses. Des évaluations effectuées par des humains confirment notre supériorité dans la génération de sondages de haute qualité, efficaces pour stimuler l’engagement des utilisateurs.