17 天前

罗马尼亚法律领域中的命名实体识别

{Alexandru Ianov, Vlad Coneschi, Carol Luca Gasan, Maria Mitrofan, Vasile Pais}
罗马尼亚法律领域中的命名实体识别
摘要

识别文本中的命名实体是信息抽取与自然语言理解的重要步骤。本文提出了一种面向罗马尼亚法律领域的命名实体识别系统。该系统基于经过人工标注的高质量法律领域语料库LegalNERo。此外,系统融合了多种词的分布式表示方法,包括在大规模法律领域语料上训练得到的词嵌入(word embeddings)。所有相关资源,包括语料库、模型及词嵌入,均已开源。最终,性能最佳的系统可通过RELATE平台直接调用使用。