Command Palette
Search for a command to run...
中国語NERにおける用語集の使用簡素化
中国語NERにおける用語集の使用簡素化
Ruotian Ma; Minlong Peng; Qi Zhang; Xuanjing Huang
概要
最近、多くの研究が語彙を使用して中国語の固有表現認識(NER)の性能を向上させる試みを行っています。その代表的な例として、Lattice-LSTM(張と楊、2018年)はいくつかの公開中国語NERデータセットで新しいベンチマーク結果を達成しています。しかし、Lattice-LSTMには複雑なモデル構造があります。これにより、リアルタイムのNER応答が必要な多くの産業分野での応用が制限されています。本研究では、単語語彙を文字表現に組み込むためのシンプルかつ効果的な方法を提案します。この方法は複雑なシーケンスモデリングアーキテクチャの設計を避けることができ、任意のニューラルNERモデルに対して文字表現層の微妙な調整のみで辞書情報を取り入れることができます。4つのベンチマーク中国語NERデータセットを用いた実験研究表明、当方法は最先端手法よりも最大6.15倍高速な推論速度を達成するとともに、より優れた性能を示しました。実験結果はまた、提案手法がBERTなどの事前学習済みモデルとの組み込みが容易であることを示しています。