11日前

Falcon 2.0:Wikidata上のエンティティおよび関係リンクツール

Ahmad Sakor, Kuldeep Singh, Anery Patel, Maria-Esther Vidal
Falcon 2.0:Wikidata上のエンティティおよび関係リンクツール
要約

自然言語処理(NLP)コミュニティは、テキストからのエンティティおよび関係認識に向けた解決策に大きく貢献しており、それらを知識グラフ(KG)内の適切なマッチングに結びつける可能性も示している。特に、背景となる知識グラフとしてWikidataを用いる場合でも、テキスト内の知識をWikidataにリンクするためのツールは依然として限られている。本論文では、Wikidata上で初めてのエンティティおよび関係の同時リンクツールであるFalcon 2.0を提案する。Falcon 2.0は英語による短い自然言語テキストを入力として受け取り、Wikidata内での適切な候補として識別されたエンティティおよび関係の順位付きリストを出力する。これらの候補は、Wikidataにおける国際化リソース識別子(IRI)によって表現される。Falcon 2.0は、認識タスクにおいて英語言語モデルを活用(例:N-gramタイリングおよびN-gram分割)し、その後、リンクタスクに対して最適化手法を適用する。我々は、Wikidata上でFalcon 2.0の性能を実証的に評価した結果、既存のすべてのベースライン手法を上回ることを確認した。Falcon 2.0は公開されており、コミュニティによる再利用が可能である。本ツールのすべての利用手順は、GitHubリポジトリにて詳細にドキュメント化されている。また、技術的知識が不要なオンラインAPIも提供しており、誰でも容易に利用可能である。Falcon 2.0およびその背景知識ベースは、https://labs.tib.eu/falcon/falcon2/ にてリソースとして公開されている。

Falcon 2.0:Wikidata上のエンティティおよび関係リンクツール | 最新論文 | HyperAI超神経