Command Palette

Search for a command to run...

4ヶ月前

イタリア語要約のための2つの新規データセット

{Edoardo Federici Riccardo La Grassa Ignazio Gallo Nicola Landro}

イタリア語要約のための2つの新規データセット

要約

テキスト要約は、与えられたテキストから関連する内容を含む短い要約を生成することを目的としている。イタリア語をはじめとする低リソース言語において、抽象的要約(abstractive summarization)のためのデータが不足していることから、本研究では2つの新しいオリジナルデータセットを提案する。これらは、イタリアのニュースサイトから収集した複数文からなる要約と対応する記事から構成され、またスペイン語の要約データセットを機械翻訳によって得たデータセットを含む。これらの2つのデータセットは、現在このタスクにおいてイタリア語で利用可能な唯一のデータセットである。これらのデータセットの品質を評価するため、T5-baseモデルおよびmBARTモデルを用いて学習を実施した結果、両モデルとも良好な性能が得られた。さらに、自動翻訳によって生成されたデータセット上で学習した同様のモデルと、同じ訓練言語における自動翻訳要約との比較を行ったところ、提案したデータセットから得られたモデルの優位性が明らかになった。

ベンチマーク

ベンチマーク方法論指標
abstractive-text-summarization-on-abstractiveIT5
ROUGE-1: 33.83
abstractive-text-summarization-on-abstractivemBART
ROUGE-1: 36.50
abstractive-text-summarization-on-abstractive-1mBART
ROUGE-1: 38.91
abstractive-text-summarization-on-abstractive-1Pegasus-CNN/DM (eng-it translation)
ROUGE-1: 23.96
abstractive-text-summarization-on-abstractive-1IT5
ROUGE-1: 33.78
abstractive-text-summarization-on-abstractive-1Pegasus-XSum (eng-it translation)
ROUGE-1: 21.03
abstractive-text-summarization-on-mlsum-itmBART
rouge1: 19.35
abstractive-text-summarization-on-mlsum-itPegasus-XSum (eng-it translation)
rouge1: 15.17
abstractive-text-summarization-on-mlsum-itIT5
rouge1: 19.29
abstractive-text-summarization-on-mlsum-itPegasus-CNN/DM (eng-it translation)
rouge1: 16.97

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
イタリア語要約のための2つの新規データセット | 論文 | HyperAI超神経