HyperAIHyperAI
vor 9 Tagen

Automatische Extraktion von Materialien und Eigenschaften aus wissenschaftlicher Literatur zu Supraleitern

Luca Foppiano, Pedro Baptista de Castro, Pedro Ortiz Suarez, Kensei Terashima, Yoshihiko Takano, Masashi Ishii
Automatische Extraktion von Materialien und Eigenschaften aus wissenschaftlicher Literatur zu Supraleitern
Abstract

Die automatische Extraktion von Materialien und zugehörigen Eigenschaften aus der wissenschaftlichen Literatur gewinnt in der datengetriebenen Materialwissenschaft (Materials Informatics) zunehmend an Bedeutung. In diesem Beitrag diskutieren wir Grobid-superconductors, unsere Lösung zur automatischen Extraktion von Supraleitermaterialnamen und deren entsprechenden Eigenschaften aus Text. Als Grobid-Modul entwickelt, kombiniert es maschinelles Lernen mit heuristischen Ansätzen in einer mehrstufigen Architektur, die sowohl rohe Texte als auch PDF-Dokumente als Eingabedaten unterstützt. Mit Grobid-superconductors haben wir die Datenbank SuperCon2 aufgebaut, die 40.324 Material- und Eigenschaftsdatensätze aus 37.700 wissenschaftlichen Arbeiten enthält. Die Materialinformationen (bzw. Probeninformationen) werden durch Namen, chemische Formeln und Materialklassen repräsentiert und durch zusätzliche Angaben wie Form, Dotierung, Substitutionsvariablen für Komponenten sowie Substrat ergänzt. Zu den Eigenschaften zählen die kritische Supraleitungstemperatur Tc sowie, falls verfügbar, der angewendete Druck und die Methode zur Messung von Tc.

Automatische Extraktion von Materialien und Eigenschaften aus wissenschaftlicher Literatur zu Supraleitern | Neueste Forschungsarbeiten | HyperAI