11日前

BillSum:米国立法の自動要約を 위한コーパス

Anastassia Kornilova, Vlad Eidelman
BillSum:米国立法の自動要約を 위한コーパス
要約

自動要約手法は、ニュース記事や科学論文など多様な分野で研究されてきた。しかし、米国連邦議会および州政府が毎年数万件の法案を公開しているにもかかわらず、立法文書についてはこれまで要約タスクの対象として検討されてこなかった。本論文では、米国連邦議会およびカリフォルニア州の法案要約を対象とした、初めてのデータセットであるBillSum(https://github.com/FiscalNote/BillSum)を紹介する。本データセットが他の分野と比べて処理の難易度が高くなる理由を解説した後、ニューラル文表現と従来の文脈特徴を組み合わせた抽出型要約手法をベンチマークした。さらに、連邦議会の法案を対象に構築されたモデルがカリフォルニア州の法案要約にも適用可能であることを示し、本データセット上で開発された手法が、人間による要約が存在しない州への汎用性(転移可能性)を有することを実証した。

BillSum:米国立法の自動要約を 위한コーパス | 最新論文 | HyperAI超神経