HyperAIHyperAI

Command Palette

Search for a command to run...

InferNER:文レベルの情報を活用した注意機構を備えたマイクロブログにおける固有表現認識用モデル

Axel-Cyrille Ngonga Ngomo Diego Esteves Ayesha Amin Moemmur Shahzad

概要

ユーザ生成テキスト、特にソーシャルメディア投稿における固有表現抽出(Named Entity Recognition, NER)の課題について検討する。このデータタイプは長さが制限されており、文法的な一貫性も乏しいため、NERの実行が特に困難である。現在の最先端手法は、地名辞書(gazetteers)などの外部情報源を活用してこの制約を緩和している。本研究では、gazetteersや同様の外部情報源に依存せずに、最先端の手法を上回る性能を発揮するニューラルモデルを提案する。本手法は、短文における単語レベル、文字レベル、文レベルの情報を統合してNERを実現する。また、ツイートなどのソーシャルメディア投稿には関連画像が付随することが多く、その画像からテキストの理解に役立つ補助的なコンテキストを獲得できる可能性がある。したがって、本研究では視覚情報も統合し、テキストとテキストに関連する視覚的コンテキストそれぞれに対して別々に注意(attention)重み確率を計算するアテンション機構を導入した。実験結果から、本モデルは複数のNERデータセットにおいて現在の最先端手法を上回ることが示された。WNUT 2016および2017のデータセットでは、それぞれ53.48%および50.52%のF1スコアを達成した。マルチモーダルモデルを用いた場合、マルチモーダルデータセットにおいてもF1スコア74%を達成し、現行の最先端手法を上回った。さらに評価結果から、本モデルはニューズリポートデータに対しても現在の最先端手法を上回る性能を発揮することが示されたことから、多様なNERタスクに適用可能な適応性が裏付けられた。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています