3ヶ月前

InferNER：文レベルの情報を活用した注意機構を備えたマイクロブログにおける固有表現認識用モデル

{Axel-Cyrille Ngonga Ngomo, Diego Esteves, Ayesha Amin, Moemmur Shahzad}

要約

ユーザ生成テキスト、特にソーシャルメディア投稿における固有表現抽出（Named Entity Recognition, NER）の課題について検討する。このデータタイプは長さが制限されており、文法的な一貫性も乏しいため、NERの実行が特に困難である。現在の最先端手法は、地名辞書（gazetteers）などの外部情報源を活用してこの制約を緩和している。本研究では、gazetteersや同様の外部情報源に依存せずに、最先端の手法を上回る性能を発揮するニューラルモデルを提案する。本手法は、短文における単語レベル、文字レベル、文レベルの情報を統合してNERを実現する。また、ツイートなどのソーシャルメディア投稿には関連画像が付随することが多く、その画像からテキストの理解に役立つ補助的なコンテキストを獲得できる可能性がある。したがって、本研究では視覚情報も統合し、テキストとテキストに関連する視覚的コンテキストそれぞれに対して別々に注意（attention）重み確率を計算するアテンション機構を導入した。実験結果から、本モデルは複数のNERデータセットにおいて現在の最先端手法を上回ることが示された。WNUT 2016および2017のデータセットでは、それぞれ53.48%および50.52%のF1スコアを達成した。マルチモーダルモデルを用いた場合、マルチモーダルデータセットにおいてもF1スコア74%を達成し、現行の最先端手法を上回った。さらに評価結果から、本モデルはニューズリポートデータに対しても現在の最先端手法を上回る性能を発揮することが示されたことから、多様なNERタスクに適用可能な適応性が裏付けられた。