HyperAIHyperAI
il y a 16 jours

MentSum : Une ressource pour explorer la résumé des publications en ligne sur la santé mentale

Sajad Sotudeh, Nazli Goharian, Zachary Young
MentSum : Une ressource pour explorer la résumé des publications en ligne sur la santé mentale
Résumé

La santé mentale demeure un enjeu majeur de santé publique à l’échelle mondiale. Avec la croissance croissante des plateformes en ligne, de nombreux utilisateurs recourent à ces espaces pour partager leurs troubles mentaux, exprimer leurs émotions et solliciter de l’aide auprès de la communauté ou de professionnels. Certaines de ces plateformes, comme Reachout, sont des forums spécialisés où les utilisateurs s’inscrivent pour obtenir du soutien. D’autres, telles que Reddit, proposent des sous-forums (subreddits) permettant aux utilisateurs de publier anonymement, mais publiquement, des messages décrivant leur détresse psychologique. Bien que ces messages varient en longueur, il est particulièrement utile de fournir un résumé concis mais informatif, afin de faciliter leur traitement rapide par les conseillers. Afin de soutenir la recherche sur la synthèse de messages en ligne liés à la santé mentale, nous introduisons le jeu de données MentSum, dédié à la synthèse de la santé mentale, comprenant plus de 24 000 messages soigneusement sélectionnés provenant de 43 sous-forums de Reddit, accompagnés de résumés courts rédigés par les utilisateurs eux-mêmes (appelés TLDR en anglais). Ce jeu de données spécifique au domaine s’avère pertinent non seulement pour la génération de résumés sur Reddit, mais également pour la synthèse des messages publiés sur des forums spécialisés comme Reachout. Nous évaluons ensuite à la fois les méthodes extraitives et abstraites de pointe en matière de synthèse, selon les scores Rouge, puis menons une étude d’évaluation humaine approfondie des résumés rédigés par les utilisateurs et générés automatiquement, mettant en lumière les défis propres à ce domaine de recherche.