MP-20-PXRD原子材料ベンチマークデータセット
※本データセットはオンライン利用に対応しておりますが、ジャンプするにはここをクリックしてください。
MP-20-PXRDベンチマークデータセットは、拡散モデルに基づく生成型人工知能構造解析手法であるPXRDnetのエンドツーエンドのトレーニング用に、2025年にコロンビア大学とスタンフォード大学によって共同で提案されました。関連研究は、「拡散モデルによるナノ結晶粉末回折データからの第一原理構造解析」というタイトルで Nature Materials に掲載されました。
データセットは、Materials Project データベースからサンプリングされた材料で構成され、ユニットセルには最大 20 個の原子が含まれます。これには 90%、7.5%、2.5% の比率でトレーニング、検証、テストに使用される 45,229 個のマテリアルが含まれています。