17日前

ルーマニア法的ドメインにおける名前付きエンティティ認識

{Alexandru Ianov, Vlad Coneschi, Carol Luca Gasan, Maria Mitrofan, Vasile Pais}
ルーマニア法的ドメインにおける名前付きエンティティ認識
要約

テキスト中に含まれる固有表現の認識は、情報抽出および自然言語理解への重要なステップである。本研究では、ルーマニア法的ドメイン向けの固有表現認識システムを提示する。このシステムは、ゴールドアノテーションが施されたLegalNERoコーパスを活用している。さらに、大規模な法的ドメインコーパス上で学習された単語埋め込みを含む、複数の分布表現を統合することで、性能を向上させている。本研究で開発されたすべてのリソース—コーパス、モデル、単語埋め込み—はオープンソースとして公開されている。最終的に、最良のシステムはRELATEプラットフォーム上で直接利用可能である。