Apporter une structure aux résumés : un jeu de données à facettes pour les documents scientifiques longs

La synthèse facettée fournit des résumés d'un document sous différents angles. Les lecteurs peuvent rapidement comprendre les points principaux d'un document long grâce à l'aide d'un plan structuré. Cependant, peu de recherches ont été menées sur ce sujet, en partie en raison du manque de grands ensembles de données de synthèse facettée. Dans cette étude, nous présentons FacetSum, un benchmark de synthèse facettée construit à partir d'articles de la revue Emerald, couvrant une gamme diversifiée de domaines. Contrairement aux paires traditionnelles document-résumé, FacetSum offre plusieurs résumés, chacun ciblant des sections spécifiques d'un document long, notamment le but, la méthode, les résultats et la valeur. Les analyses et les résultats empiriques sur notre ensemble de données mettent en évidence l'importance d'introduire une structure dans les résumés. Nous pensons que FacetSum stimulera des avancées supplémentaires dans la recherche sur la synthèse et favorisera le développement de systèmes TALN capables d'exploiter les informations structurées présentes tant dans les textes longs que dans les résumés.