2ヶ月前

54言語における品詞タギング、語幹化、および依存関係解析に対する文脈化された埋め込みの評価

Milan Straka; Jana Straková; Jan Hajič
54言語における品詞タギング、語幹化、および依存関係解析に対する文脈化された埋め込みの評価
要約

私たちは、Universal Dependencies 2.3 の 54 言語にわたる 89 のコーパスを対象とした、最近提案されたコンテキスト化された埋め込みの 3 つの手法について広範な評価を行いました。この評価は、POS タギング、レマ化、および依存関係解析という 3 つのタスクで行われました。BERT、Flair、ELMo を事前学習済みの埋め込み入力として使用し、CoNLL 2018 共通タスクで最高性能を示したシステムの一つであり、EPE 2018 の全体的な勝者でもある UDPipe 2.0 の強力なベースラインにおいて、これらの 3 つのコンテキスト化された単語埋め込み手法の一対一比較を行いました。また、word2vec 風の事前学習済み埋め込みやエンドツーエンドの文字レベル単語埋め込みとの比較も行っています。私たちは UD 2.2 上での CoNLL 2018 共通タスクの結果と比較して、すべての 3 つのタスクで最先端の結果を報告しています。

54言語における品詞タギング、語幹化、および依存関係解析に対する文脈化された埋め込みの評価 | 最新論文 | HyperAI超神経