HyperAIHyperAI

Command Palette

Search for a command to run...

UniTrans: 不明データを用いたクロスリンガルな固有表現認識におけるモデル転送とデータ転送の統一

Qianhui Wu Zijia Lin Börje F. Karlsson Biqing Huang Jian-Guang Lou

概要

言語間の固有表現認識(Cross-lingual Named Entity Recognition, NER)において、ラベル付きデータが存在しないか少ない場合の先行研究は、主にモデル転送ベースとデータ転送ベースの手法に分類されます。本論文では、これらの手法が互いに補完し合う可能性があることを示しています。すなわち、前者は言語非依存の特徴を用いて文脈情報を活用できますが、ターゲット言語におけるタスク固有の情報を見ることができません。一方、後者は翻訳を介して疑似ターゲット言語学習データを生成しますが、不正確な翻訳により文脈情報の活用が弱まってしまいます。さらに、先行研究ではターゲット言語におけるラベルなしデータを活用することは稀であり、このデータは容易に収集でき、結果の向上に有用な情報を含んでいる可能性があります。これらの問題に対処するため、我々はモデル転送とデータ転送を統合し、さらにラベルなしのターゲット言語データから得られる情報を強化された知識蒸留を通じて活用する新しいアプローチであるUniTrans(ユニトランス)を提案します。我々は4つのターゲット言語についてベンチマークデータセット上で提案したUniTransを評価しました。実験結果は、既存の最先端手法に対して大幅に性能を上回ることを示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
UniTrans: 不明データを用いたクロスリンガルな固有表現認識におけるモデル転送とデータ転送の統一 | 記事 | HyperAI超神経