2ヶ月前
抽出か推測か?イベントの時間関係抽出の忠実性向上
Haoyu Wang; Hongming Zhang; Yuqian Deng; Jacob R. Gardner; Dan Roth; Muhao Chen

要約
本論文では、TempRel抽出モデルの忠実性を2つの観点から向上させる方法を探求します。第1の観点は、文脈的な説明に基づいて真正に抽出することです。これを行うために、事象トリガーバイアスと頻繁ラベルバイアスという2つの重要な訓練バイアスの影響を軽減するために反実仮想分析(counterfactual analysis)を提案します。また、イベント表現に時制情報を追加することで、文脈的な説明に明確な重点を置きます。第2の観点は、テキスト中に関係が記述されていない場合に適切な不確実性推定を行い、抽出を控えることです。モデルが予測するカテゴリ分布に対してディリクレ事前分布(Dirichlet Prior)のパラメータ化を行い、モデルの正解度推定値を改善し、TempRel予測をより選択的にする方法を提案します。さらに、バイアス軽減後にもモデルの信頼度指標を見直すために温度スケーリング(temperature scaling)を使用します。MATRES, MATRES-DS, およびTDDiscourseにおける実験解析を通じて、我々のモデルがSOTA手法と比較して特に分布シフト下でより忠実にTempRelとタイムラインを抽出できることを示しています。