12日前

HTSS:新たなハイブリッドテキスト要約および簡素化アーキテクチャ

{Raheel Nawaz, Naif Radi Aljohani, Saeed-Ul Hassan, Matthew Shardlow, Farooq Zaman}
要約

テキスト簡略化(text simplification)と要約(text summarisation)は、自然言語生成(Natural Language Generation)における関連するが異なるサブタスクである。要約は文書の長さを短縮しつつも元の意味を保持することを目的とするのに対し、簡略化は文書の複雑さを低減することを目的としている。本研究では、抽象的要約(abstractive summarisation)と抽出的要約(extractive summarisation)を組み合わせた新しいハイブリッドアーキテクチャであるHTSS(Hybrid Text Simplification and Summarisation)を用いて、両タスクを統合的に処理する手法を提案する。また、既存の指標生成モデル(pointer generator model)を拡張し、要約と簡略化の併行処理に適応させた。本研究で用いた並列コーパスは、科学ニュースサイト「EurekaAlert(www.eurekalert.org)」に公開されたドメイン専門家による簡略化された要約から収集した。実験結果から、提案するHTSSモデルは、SARIスコアにおいてニューラルテキスト簡略化(NTS)を上回り、ROUGEスコアにおいて抽象的要約(ATS)を上回ることが示された。さらに、SARIとROUGEを統合した新たな評価指標(CSS1)を導入し、簡略化と要約の統合タスクにおいて、NTSおよびATSと比較してそれぞれ38.94%および53.40%の性能向上を達成した。本研究で開発したすべてのコード、モデル、およびコーパスは、今後の研究を支援するため、以下のURLから科学コミュニティに公開している:https://github.com/slab-itu/HTSS/。

HTSS:新たなハイブリッドテキスト要約および簡素化アーキテクチャ | 最新論文 | HyperAI超神経