11日前

TENER:名前付きエンティティ認識のためのTransformerエンコーダーの適応

Hang Yan, Bocao Deng, Xiaonan Li, Xipeng Qiu
TENER:名前付きエンティティ認識のためのTransformerエンコーダーの適応
要約

双方向長短期記憶ネットワーク(BiLSTM)は、固有表現抽出(NER)タスクを解くモデルにおけるエンコーダとして広く用いられてきた。近年、並列処理が可能で優れた性能を発揮する点から、Transformerはさまざまな自然言語処理(NLP)タスクに広く採用されている。しかし、TransformerのNERにおける性能は、他のNLPタスクほど優れていないのが現状である。本論文では、文字レベル特徴と単語レベル特徴をモデル化するために、適応型Transformerエンコーダを採用するNERアーキテクチャ「TENER」を提案する。方向性と相対距離を意識したアテンションおよびスケーリングなしのアテンションを組み込むことで、Transformer型エンコーダが他のNLPタスクと同様にNERにおいても有効であることを実証した。