17日前

トランスファーラーニングと文単位特徴を用いたツイート上の固有表現抽出

{Pius von D{\a}niken, Mark Cieliebak}
トランスファーラーニングと文単位特徴を用いたツイート上の固有表現抽出
要約

WNUT 2017におけるツイッターデータ向け命名エンティティ認識チャレンジ向けに、本研究では自らのシステムを提示する。我々は、シーケンスタグ付けのための基本的なニューラルネットワークアーキテクチャに対する2つの改良手法を説明する。まず、ターゲットタスクとは異なる命名エンティティタグを持つ追加のラベル付きデータを活用する方法を示す。次に、文レベルの特徴を統合する手法を提案する。本システムでは、これらの2つの手法を併用しており、エンティティレベルのアノテーションにおいて第2位(F1スコア40.78)、サーフェスフォームのアノテーションにおいても第2位(F1スコア39.33)を達成した。