要約
要旨となる情報を抽出するためには、表現間の関係性を検出するという作業が常に要となる抽象的要約の技術的アートである。本研究では、抽出器(extractor)と要約器(abstractor)から構成されるシステムの改良版であるSEGMENTを提案する。このシステムにおいて、抽出器は要約対象となる語句を特定し、要約器はその特徴を活用して自然な要約文を生成する。さらに、要約器に豊富な情報を提供するための「セグメント埋め込み層(segment embedding layer)」を導入することで、語句間の整合性を高め、一貫性のある要約生成を実現した。抽出器では、フィルタリング機構と位置認識(position awareness)を統合することで、情報選択の質を向上させた。実験結果から、CNN/Daily Mail(CNN/DM)データセットにおいて本手法は顕著な性能向上を示し、ROUGE-1において既存の最先端手法を5.1%、ROUGE-2では5%上回った。