Command Palette
Search for a command to run...
完全参照解決のためのクラスターランキングモデル
完全参照解決のためのクラスターランキングモデル
Juntao Yu Alexandra Uma Massimo Poesio
概要
CONLL 2012データセット向けに設計された参照解決(コアファラ)システムは、通常、シングルトンの同定や特定の非参照表現(例:付加語的表現、expletives)の処理といった、完全な参照解決タスクの重要な側面に対応できない。これは、これらの側面が当該コーパスではアノテーションされていないためである。しかし、近年公開されたCRAC 2018共同タスク用データセットを用いることで、こうした課題の検出が可能となった。本論文では、非参照表現(付加語的表現、expletives、その他種類を含む)の同時同定と、シングルトンを含むコアファラチェーンの構築を実現するアーキテクチャを提案する。本研究で用いるクラスターランキングシステムは、同一クラスタ内の参照表現の相対的重要性を評価するためにアテンション機構を活用する。さらに、シングルトンおよび非参照マーカブルの識別に向けた追加の分類器を導入している。本研究の貢献は以下の通りである。第一に、我々は、システムが生成した参照表現(system mentions)を用いたCRACデータセットに対する初めての結果を報告する。その結果、金標準の参照表現(gold mentions)を使用した共同タスクベースラインシステムと比較して、5.8%の性能向上を達成した。第二に、シングルトンクラスタおよび非参照表現の可用性が、非シングルトンクラスタの性能向上にも顕著な効果をもたらすことを示した。第三に、本モデルはCONLLデータセット専用に設計されていないにもかかわらず、KantorとGloberson(2019)が提案した最先端システムと同等のスコアを達成したことを示した。