HyperAI

1. Ensemble De Données Sur Les Matériaux Inorganiques OMat24

特色图像

Dans le contexte de l’intégration accélérée de l’intelligence artificielle et de la science des matériaux, les ensembles de données deviennent progressivement le moteur principal du changement de paradigme dans la recherche sur les matériaux. La transition des méthodes de calcul traditionnelles basées sur des modèles physiques vers une prédiction intelligente basée sur les données dépend non seulement de l’amélioration des performances des algorithmes, mais également du support de données matérielles de haute qualité. L'exhaustivité, la précision et la répétabilité des données déterminent directement la limite supérieure des performances du modèle dans des tâches telles que la prédiction des propriétés des matériaux, la génération de structures et la découverte de fonctions.

Contrairement à des domaines tels que les images ou le langage naturel, les données matérielles sont hautement structurées et présentent des caractéristiques telles que des contraintes physiques complexes, un couplage multi-échelle et une fusion intermodale, ce qui rend le seuil de construction de son ensemble de données plus élevé. Qu'il s'agisse des résultats de calculs de principes fondamentaux ou de données de mesure expérimentales, leur collecte, leur nettoyage, leur normalisation, leur étiquetage et leur stockage doivent suivre strictement des processus scientifiques pour garantir la crédibilité et la capacité de généralisation des données.

En particulier, l’organisation systématique des données sur la structure cristalline et les propriétés des matériaux rend le chemin entre la modélisation physique de base et la modélisation par apprentissage automatique plus réalisable. Les informations multidimensionnelles contenues dans l'ensemble de données, telles que l'énergie de formation, la bande interdite, le volume, la densité, etc., fournissent une base de données solide aux chercheurs pour effectuer des prédictions de propriétés, des criblages de matériaux et des analyses d'applications potentielles. Dans le même temps, les formats standardisés, les systèmes de dénomination unifiés et les métadonnées riches améliorent également considérablement la traçabilité des données et la disponibilité multiplateforme.

Afin d'aider les chercheurs dans des domaines connexes à mieux mener leurs recherches,HyperAI a compilé les ensembles de données sur la science des matériaux qui suscitent actuellement une large attention dans l'industrie, ainsi que des didacticiels de déploiement en un clic.Couvrant plusieurs directions clés telles que les matériaux quantiques, les matériaux inorganiques, les structures cristallines, etc., il permet aux données matérielles complexes et vastes de véritablement servir les chercheurs.

Cliquez pour voir plus d'ensembles de données open source :

https://go.hyper.ai/g9PvL

Résumé de l'ensemble de données sur les matériaux

1. Ensemble de données sur les matériaux inorganiques OMat24

    Taille estimée :185,67 Go

    Adresse de téléchargement :https://go.hyper.ai/hptlY

    En 2024, Meta a publié l'ensemble de données open source à grande échelle Open Materials 2024 (OMat24), qui contient plus de 110 millions de résultats de calcul DFT axés sur la diversité structurelle et compositionnelle, couvrant différentes configurations atomiques échantillonnées à partir de structures à l'équilibre et hors équilibre. Il s’agit actuellement du plus grand ensemble de données open source pour la formation de modèles alternatifs DFT de matériaux.

    2. OQMD 开源量子材料数据集

    Taille estimée :32,89 Go

    Adresse de téléchargement :https://go.hyper.ai/qDyGS

    L'ensemble de données OQMD contient les propriétés thermodynamiques et structurelles de plus de 1 226 781 matériaux calculées par la théorie de la fonctionnelle de la densité (DFT). Les données proviennent de la base de données sur la structure cristalline inorganique (ICSD), comprenant des calculs d'énergie totale DFT de près de 300 000 composés et des modifications de structures cristallines courantes, visant à stocker et à partager des données sur les matériaux quantiques.

    3. Materials Project 在线材料数据集

    Adresse de téléchargement :https://go.hyper.ai/ELmmX

    Le projet Matériaux est un vaste ensemble de données de matériaux en ligne ouvert. Les données comprennent la structure cristalline, les caractéristiques énergétiques, la structure électronique et les propriétés thermodynamiques, couvrant de multiples aspects tels que la représentation des matériaux, les propriétés optoélectroniques, les propriétés mécaniques, les propriétés physico-chimiques, la stabilité et la réactivité, les propriétés thermodynamiques et les propriétés magnétiques.

    4. LLM4Mat-Bench 晶体结构数据集

    Adresse de téléchargement :https://go.hyper.ai/fSTbI

    LLM4Mat-Bench est un ensemble de données d'évaluation de modèles de langage multimodaux pour la prédiction des propriétés des matériaux. Il contient environ 1,97 million d'échantillons de structures cristallines provenant de 10 bases de données publiques de matériaux, couvrant 45 propriétés physiques et chimiques différentes des matériaux. Il s’agit de la plus grande référence à ce jour pour évaluer les performances des grands modèles de langage (LLM) pour la prédiction des propriétés des matériaux.

    5. Material DFT 材料属性数据集

    Adresse de téléchargement :https://go.hyper.ai/ju56p

    Cet ensemble de données fournit un grand nombre d'enregistrements de propriétés matérielles de haute qualité provenant de la base de données Materials Project, couvrant une variété de compositions chimiques et de propriétés physiques. Chaque enregistrement correspond à un matériau unique et toutes les propriétés sont obtenues grâce à des calculs de théorie fonctionnelle de la densité (DFT).

    Tutoriel classique

    En plus des données de haute qualité, le site Web officiel d'HyperAI a également lancé la « démonstration du modèle de conception de matériaux inorganiques MatterGen », qui prend en charge le déploiement en un clic, réduisant considérablement le seuil d'utilisation.

    Adresse du tutoriel :https://go.hyper.ai/5mWaL

    MatterGen est un modèle de conception de matériaux inorganiques basé sur l'IA générative lancé par Microsoft, qui vise à générer directement de nouveaux matériaux avec des propriétés chimiques, mécaniques, électroniques ou magnétiques spécifiques via des modèles de diffusion.

    Plus précisément, le modèle MatterGen est principalement basé sur une architecture de diffusion. Il détruit d'abord progressivement le type atomique, la position atomique et le réseau périodique en une structure aléatoire, puis entraîne un modèle pour terminer ce processus en sens inverse, permettant au modèle d'apprendre à restaurer progressivement la structure matérielle d'origine à partir du bruit aléatoire. Xie Tian, l'auteur correspondant de l'article, estime que cela est très similaire à l'idée centrale de la génération vidéo.

    Ce qui précède est l'ensemble de données matérielles compilé par HyperAI. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, n'hésitez pas à laisser un message ou à soumettre une contribution pour nous le faire savoir !