11日前

長文ドキュメント要約のための分割統治アプローチ

Alexios Gidiotis, Grigorios Tsoumakas
長文ドキュメント要約のための分割統治アプローチ
要約

長文ドキュメントのニューラル要約に関する、新たな分割統治型手法を提案する。本手法はドキュメントの話法構造を活用し、文の類似度を用いて要約問題を複数の小さな要約問題の集合に分割する。具体的には、長文ドキュメントとその要約を複数のソース・ターゲットペアに分割し、各部分の要約を個別に学習できるモデルを訓練する。その後、これらの部分要約を統合して最終的な完全な要約を生成する。このアプローチにより、長文要約という複雑な問題をより小さく単純な問題に分解でき、計算複雑度を低減するとともに、より多くのトレーニング例を生成できる。また、従来手法と比較して、ターゲット要約におけるノイズも少ない。本手法を、シーケンス・トゥ・シーケンスRNNやTransformerといった異なる要約モデルと組み合わせることで、要約性能の向上が示された。特に、本研究で得られた最良のモデルは、公開されている2つの学術論文データセットにおいて、最先端の性能と同等の結果を達成した。

長文ドキュメント要約のための分割統治アプローチ | 最新論文 | HyperAI超神経