11日前

制御可能な文の簡略化

Louis Martin, Benoît Sagot, Éric de la Clergerie, Antoine Bordes
制御可能な文の簡略化
要約

テキスト簡略化は、文法や構造を簡素化しつつも、元の情報内容を保持することで、テキストの読解と理解を容易にする手法である。これは一般的に、すべての利用者に共通して適用可能な汎用的なタスクと見なされるが、異なる利用者層が異なる目的で簡略化テキストから利点を得られる可能性がある。本研究では、シーケンス・トゥ・シーケンスモデルに基づく簡略化システムに対して明示的な制御を可能にする離散的パラメータ化機構を採用している。これにより、ユーザーは出力される簡略化テキストの長さ、言い換えの程度、語彙の難易度、構文の複雑さといった属性に基づいて、モデルの出力を条件づけることができる。また、これらの属性に対して適切な値を選定することで、標準的なシーケンス・トゥ・シーケンスモデルが、簡略化ベンチマークにおいて従来の最良手法を上回ることを示している。本研究で提案するモデルは、利用者中心の文簡略化を意味する略語として「ACCESS(AudienCe-CEntric Sentence Simplification)」と命名しており、WikiLargeテストセットにおいて41.87のSARIスコアを達成し、これまでに報告された最高スコアを+1.42上回る、最新の性能を実現した。

制御可能な文の簡略化 | 最新論文 | HyperAI超神経