HyperAIHyperAI

Command Palette

Search for a command to run...

100言語におけるエンティティリンクング

Jan A. Botha Zifei Shan Daniel Gillick

概要

我々は、言語特有の表記が言語に依存しない知識ベースに一致する新たな多言語エンティティリンクの定式化を提案する。この新設定において、従来の研究を基に、より洗練された特徴表現、ネガティブマイニング手法、および補助的なエンティティペアリングタスクを導入したデュアルエンコーダーを学習することで、100言語以上、2,000万エンティティをカバーする単一のエンティティ検索モデルを構築した。このモデルは、はるかに限られた多言語リンクタスクに比べて、最先端の成果を上回っている。大規模な設定において、稀なエンティティや低リソース言語が大きな課題となるため、ゼロショットおよびフェイショット評価への注力が強く求められる。こうした目的の下、本研究では、我々の設定に適合した大規模な新規多言語データセット「Mewsli-9」(http://goo.gle/mewsli-dataset)を提供し、頻度に基づく分析がモデル設計および学習の改善に重要な知見をもたらしたことを示した


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています