2ヶ月前
IAM: 統合された議論マイニングタスクのための包括的かつ大規模なデータセット
Liying Cheng; Lidong Bing; Ruidan He; Qian Yu; Yan Zhang; Luo Si

要約
従来、討論は多くの記事を読むこと、主張を選択すること、主張の立場を特定すること、主張の証拠を探すなど、手動での準備プロセスを必要としてきました。近年、AI討論が注目を集めているため、討論システムに関連する煩雑なプロセスを自動化する方法を探る価値があります。本研究では、主張抽出、立場分類、証拠抽出などの一連の主張マイニングタスクに適用できる包括的かつ大規模なデータセットIAMを紹介します。当該データセットは123のトピックに関連する1,000以上の記事から収集され、約70,000の文がその論理性(例:主張、立場、証拠など)に基づいて完全にアノテーションされています。さらに、討論準備プロセスに関連する2つの新しい統合された主張マイニングタスクを提案します:(1) 立場分類付き主張抽出 (Claim Extraction with Stance Classification: CESC) および (2) 主張-証拠ペア抽出 (Claim-Evidence Pair Extraction: CEPE)。各統合タスクに対してパイプラインアプローチとエンドツーエンド手法を採用しています。実験結果は有望であり、我々が提案したタスクの価値と課題を示し、今後の主張マイニングに関する研究への動機付けとなっています。