
摘要
本文研究了结合语义技术与神经网络嵌入方法,实现表格数据的自动化注释。具体而言,我们提出了一种锚定模型,将数据嵌入空间中的属性类型与单元格类型,与本体中的关系类型和实体类型进行对齐。实验结果表明,通过融合符号推理、神经嵌入以及损失函数设计的优势,基于DBpedia和Wikidata表格提取数据,可在列属性注释上达到86%的准确率,列类型注释达到82%,列限定符注释达到87%的显著性能提升。
本文研究了结合语义技术与神经网络嵌入方法,实现表格数据的自动化注释。具体而言,我们提出了一种锚定模型,将数据嵌入空间中的属性类型与单元格类型,与本体中的关系类型和实体类型进行对齐。实验结果表明,通过融合符号推理、神经嵌入以及损失函数设计的优势,基于DBpedia和Wikidata表格提取数据,可在列属性注释上达到86%的准确率,列类型注释达到82%,列限定符注释达到87%的显著性能提升。