2ヶ月前

低リソース環境における堅牢かつドメイン適応型の固有表現認識手法

Houjin Yu; Xian-Ling Mao; Zewen Chi; Wei Wei; Heyan Huang
低リソース環境における堅牢かつドメイン適応型の固有表現認識手法
要約

最近、限られたアノテーションデータを使用して信頼性の高い固有表現認識(NER)システムを構築することが注目を集めています。既存のほとんど全ての研究は、外部辞書や知識ベースなどのドメイン固有のリソースに大きく依存しています。しかし、このようなドメイン固有のリソースはしばしば利用できず、またその構築は困難かつ費用がかかり、これがより広範な採用における主要な障壁となっています。この問題に対処するため、本研究では低リソース環境下でのNER向けに新しい堅牢でドメイン適応型手法RDANERを提案します。この手法は安価で容易に入手可能なリソースのみを使用します。3つのベンチマークデータセットを用いた広範な実験により、当手法が安価で容易に入手可能なリソースのみを使用した場合に最良の性能を達成し、難易度の高いドメイン固有リソースを使用する最先端手法と競合する結果を示すことが確認されました。当研究におけるすべてのコードとコーパスはhttps://github.com/houking-can/RDANER から入手可能です。

低リソース環境における堅牢かつドメイン適応型の固有表現認識手法 | 最新論文 | HyperAI超神経