
초록
결정 물질의 양자역학적 계산된 성질을 담은 대규모 데이터셋을 그래프 표현 학습을 위해 소개한다. 이 데이터셋은 약 90만 개의 항목을 포함하고 있으며, OQM9HK로 명명되었다. 이 데이터셋은 100만 개 이상의 항목을 포함한 Open Quantum Materials Database (OQMD) v1.5 기반으로 구축되었으며, 약 60만 개의 항목을 포함한 이전 버전인 OQMD v1.2 데이터셋(OQM6HK)의 후속 버전이다. 결정 구조를 더 효과적으로 표현하기 위해 이진 엣지 레이블(Edge-Labeled, BEL) 그래프를 생성하는 알고리즘을 개발하였다. BEL 그래프는 엣지 레이블이 없는 그래프에 비해 결정 구조를 더 높은 표현력을 갖는다. 재료 성질 예측 작업에서 BEL 그래프 데이터셋으로 학습된 결정 그래프 신경망은 다른 그래프 데이터셋으로 학습된 모델보다 우수한 성능을 보였다. OQM9HK 그래프 데이터셋은 Zenodo 저장소에서 제공되며, 다음 링크에서 접근할 수 있다: https://doi.org/10.5281/zenodo.7124330