18日前

位置情報を意識するアテンションと教師データによる性能向上がスロットフィリングを改善する

{Victor Zhong, Gabor Angeli, Danqi Chen, Yuhao Zhang, Christopher D. Manning}
位置情報を意識するアテンションと教師データによる性能向上がスロットフィリングを改善する
要約

関係性を体系的に整理した知識形式として「知識グラフ」は、多くの応用において重要である。しかし、文書から自動的に抽出された事実で知識ベースを充填する能力は、これまで著しく遅々として進んでいない。本論文では、従来の研究を阻害してきた二つの課題に同時に取り組む。まず、LSTM系列モデルと、関係抽出に適したより優れたエンティティ位置に依存するアテンション機構を組み合わせた効果的な新モデルを提案する。次に、TAC KBPの関係を対象として、クラウドソーシングにより収集された大規模な教師あり関係抽出データセットTACRED(119,474例)を構築する。より質の高い教師ありデータと、より適切な高容量モデルの組み合わせにより、関係抽出の性能が大幅に向上する。この新データセットで訓練されたモデルを、TAC KBP 2015の最良スロットフィルリングシステムの従来の関係抽出部に置き換えると、F1スコアは22.2%から26.7%へと顕著に向上する。