HyperAIHyperAI
il y a 2 mois

Simplifier la science : Corpus pour la vulgarisation des résumés de littérature scientifique

Tomas Goldsack; Zhihao Zhang; Chenghua Lin; Carolina Scarton
Simplifier la science : Corpus pour la vulgarisation des résumés de littérature scientifique
Résumé

La synthèse vulgarisée vise à résumer et simplifier un texte donné, rendant ainsi son contenu plus compréhensible pour les non-experts. Les approches automatiques de synthèse vulgarisée peuvent apporter une valeur significative en élargissant l'accès à la littérature scientifique, permettant un degré accru d'échange interdisciplinaire des connaissances et de compréhension publique des résultats de recherche. Cependant, les corpus actuels pour cette tâche sont limités par leur taille et leur portée, entravant le développement d'approches basées sur les données largement applicables. Dans le but de remédier à ces problèmes, nous présentons deux nouveaux ensembles de données pour la synthèse vulgarisée : PLOS (à grande échelle) et eLife (à moyenne échelle), chacun contenant des articles de journaux biomédicaux accompagnés de résumés vulgarisés écrits par des experts. Nous fournissons une caractérisation détaillée de nos résumés vulgarisés, soulignant les différences de lisibilité et d'abstraction entre les ensembles de données qui peuvent être exploitées pour répondre aux besoins d'applications variées. Enfin, nous évaluons nos ensembles de données en utilisant des approches mainstream de synthèse et réalisons une évaluation manuelle avec des experts du domaine, démontrant leur utilité et mettant en lumière les principaux défis de cette tâche.

Simplifier la science : Corpus pour la vulgarisation des résumés de littérature scientifique | Articles de recherche récents | HyperAI