17日前

名前付きエンティティ認識のための類似度ベースの補助分類器

{Wenge Rong, Zhang Xiong, Yuanxin Ouyang, Jianxin Yang, Shiyuan Xiao}
名前付きエンティティ認識のための類似度ベースの補助分類器
要約

名前付きエンティティ認識(NER)タスクにおいて、分割問題(segmentation problem)は、エンティティ語の連続列を検出する際の境界誤差を低減することを目的とした、基本的な課題の一つである。多数の先進的手法が提案されてきたが、エンティティが長くなるにつれて性能が低下する傾向を示すものが多数存在する。これまでの研究では、マルチタスク戦略を用いて分割問題を解決するアプローチが報告されており、これを踏まえて本研究では、エンティティ語と非エンティティ語を区別できる類似度に基づく補助分類器(Similarity-based Auxiliary Classifier, SAC)を提案する。従来の分類器とは異なり、SACはタグをベクトルで表現する。この仕組みにより、語とタグの類似度を計算し、タグベクトルの重み付き和を算出できる。この重み付き和は、NERタスクにおける有用な特徴と見なすことができる。実験結果により、SAC構造の妥当性が検証されるとともに、ベースライン手法に対するSACモデルの性能向上の可能性が示された。