9 天前

超导体科学文献中材料与性能的自动提取

Luca Foppiano, Pedro Baptista de Castro, Pedro Ortiz Suarez, Kensei Terashima, Yoshihiko Takano, Masashi Ishii
超导体科学文献中材料与性能的自动提取
摘要

在数据驱动型材料科学(材料信息学)领域,从科学文献中自动提取材料及其相关性质正日益受到关注。本文介绍了我们提出的一种解决方案——Grobid-superconductors,该工具能够自动从文本中提取超导材料名称及其相应物理性质。Grobid-superconductors 作为一个 Grobid 模块构建,采用多步骤架构,融合了机器学习与启发式方法,支持原始文本或 PDF 文档作为输入数据。基于 Grobid-superconductors,我们构建了 SuperCon2 数据库,其中包含来自 37,700 篇文献的 40,324 条材料与性质记录。材料(或样品)信息以名称、化学式和材料类别进行表示,并附加形状、掺杂情况、组分替代变量以及基底等辅助信息。所记录的性质包括超导临界温度 Tc,以及在有可用数据时的外加压力和 Tc 测量方法。

超导体科学文献中材料与性能的自动提取 | 最新论文 | HyperAI超神经