HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Deux nouveaux jeux de données pour la résumé abstrait de texte en italien

{Edoardo Federici Riccardo La Grassa Ignazio Gallo Nicola Landro}

Deux nouveaux jeux de données pour la résumé abstrait de texte en italien

Résumé

La résumé automatique vise à produire un résumé concis contenant les éléments pertinents d’un texte donné. En raison du manque de données pour la résumé abstraite dans les langues à faible ressource telles que l’italien, nous proposons deux nouveaux jeux de données originaux, recueillis à partir de deux sites web d’actualités italiens offrant des résumés multi-phrases associés à leurs articles respectifs, ainsi qu’à partir d’un jeu de données obtenu par traduction automatique d’un jeu de données espagnol pour la résumé. Ces deux jeux de données constituent actuellement les seuls disponibles en italien pour cette tâche. Pour évaluer la qualité de ces deux jeux de données, nous les avons utilisés pour entraîner un modèle T5-base et un modèle mBART, obtenant de bons résultats avec les deux. Afin d’évaluer plus précisément les performances obtenues, nous avons également comparé ces mêmes modèles entraînés sur des jeux de données traduits automatiquement, ainsi que les résumés générés dans la même langue d’entraînement, avec des résumés traduits automatiquement, ce qui a mis en évidence l’infériorité des résultats issus des données traduites, confirmant ainsi l’avantage des modèles formés à partir des jeux de données proposés.

Benchmarks

BenchmarkMéthodologieMétriques
abstractive-text-summarization-on-abstractiveIT5
ROUGE-1: 33.83
abstractive-text-summarization-on-abstractivemBART
ROUGE-1: 36.50
abstractive-text-summarization-on-abstractive-1mBART
ROUGE-1: 38.91
abstractive-text-summarization-on-abstractive-1Pegasus-CNN/DM (eng-it translation)
ROUGE-1: 23.96
abstractive-text-summarization-on-abstractive-1IT5
ROUGE-1: 33.78
abstractive-text-summarization-on-abstractive-1Pegasus-XSum (eng-it translation)
ROUGE-1: 21.03
abstractive-text-summarization-on-mlsum-itmBART
rouge1: 19.35
abstractive-text-summarization-on-mlsum-itPegasus-XSum (eng-it translation)
rouge1: 15.17
abstractive-text-summarization-on-mlsum-itIT5
rouge1: 19.29
abstractive-text-summarization-on-mlsum-itPegasus-CNN/DM (eng-it translation)
rouge1: 16.97

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Deux nouveaux jeux de données pour la résumé abstrait de texte en italien | Articles de recherche | HyperAI