9日前

超伝導体の科学文献からの材料および物性の自動抽出

Luca Foppiano, Pedro Baptista de Castro, Pedro Ortiz Suarez, Kensei Terashima, Yoshihiko Takano, Masashi Ishii
超伝導体の科学文献からの材料および物性の自動抽出
要約

データ駆動型材料科学(マテリアルズインフォマティクス)において、科学文献から材料および関連する物性を自動抽出する技術が注目を集めている。本論文では、テキストから超伝導体材料名およびその物性を自動抽出するためのソリューションとして、Grobid-superconductorsを提案する。このツールはGrobidモジュールとして構築されており、機械学習とヒューリスティック手法を組み合わせた多段階アーキテクチャを採用しており、生テキストまたはPDFドキュメントを入力データとして扱える。Grobid-superconductorsを活用して、37,700編の論文から抽出した40,324件の材料および物性レコードを収録したデータベース「SuperCon2」を構築した。材料(または試料)情報は、名称、化学式、材料クラスで表現され、形状、ドーピング状態、成分の置換変数、基板情報といった付加的情報とともに記述される。物性データとしては、超伝導転移温度Tcが含まれ、必要に応じてTc測定時に加えられた圧力および測定手法も記録されている。

超伝導体の科学文献からの材料および物性の自動抽出 | 最新論文 | HyperAI超神経