HyperAI초신경

무기재료 설계/결정구조 예측/재료 특성 기록 등을 다루고 Meta/Microsoft 및 기타 기관의 오픈소스 데이터 세트와 모델을 요약합니다.

2달 전
정보
h.li
特色图像

인공지능과 재료과학의 급속한 통합을 배경으로, 데이터 세트는 점차 재료 연구의 패러다임 전환을 주도하는 핵심 엔진이 되고 있습니다. 물리적 모델을 기반으로 하는 기존 컴퓨팅 방법에서 데이터 기반의 지능형 예측으로의 전환은 알고리즘 성능의 향상뿐 아니라 고품질 재료 데이터의 지원에도 달려 있습니다. 데이터의 포괄성, 정확성, 반복성은 재료 속성 예측, 구조 생성, 기능 발견 등의 작업에서 모델 성능의 상한을 직접적으로 결정합니다.

이미지나 자연어와 같은 분야와 달리 물질 데이터는 고도로 구조화되어 있으며 복잡한 물리적 제약, 다중 스케일 결합, 교차 모드 융합과 같은 특성을 가지고 있어 데이터 세트를 구축하기 위한 임계값이 더 높습니다. 1차 원리 계산 결과이든 실험 측정 데이터이든, 데이터의 신뢰성과 일반화 능력을 보장하기 위해 수집, 정리, 표준화, 라벨링 및 저장은 반드시 과학적 절차를 엄격히 따라야 합니다.

특히, 결정 구조와 물질 특성 데이터의 체계적인 구성으로 인해 기본 물리 모델링에서 머신 러닝 모델링으로의 경로가 더욱 실현 가능해졌습니다. 형성 에너지, 밴드갭, 부피, 밀도 등 데이터 세트에 포함된 다차원 정보는 연구자들이 속성 예측, 재료 선별, 잠재적 응용 분석을 수행할 수 있는 견고한 데이터 기반을 제공합니다. 동시에 표준화된 형식, 통합된 명명 시스템, 풍부한 메타데이터를 통해 데이터 추적성과 플랫폼 간 가용성이 크게 향상됩니다.

관련 분야 학자들이 연구를 보다 잘 수행할 수 있도록 돕기 위해,HyperAI는 현재 업계에서 폭넓은 주목을 받고 있는 재료 과학 데이터 세트를 편집했으며, 원클릭 배포 튜토리얼도 제공합니다.양자 물질, 무기 물질, 결정 구조 등 여러 핵심 방향을 포괄하여 복잡하고 방대한 물질 데이터를 제공하여 연구자에게 실질적인 도움을 제공합니다.

더 많은 오픈 소스 데이터 세트를 보려면 클릭하세요.https://go.hyper.ai/g9PvL

재료 데이터 세트 요약

1. OMat24 무기 재료 데이터세트

예상 크기:185.67GB

다운로드 주소:https://go.hyper.ai/hptlY

2024년에 Meta는 1억 1천만 개 이상의 DFT 계산 결과를 포함하는 대규모 오픈 소스 데이터 세트인 Open Materials 2024(OMat24)를 출시했습니다. 이 데이터 세트는 평형 및 비평형 구조에서 샘플링된 다양한 원자 구성을 다루는 구조적 및 구성적 다양성에 초점을 맞춥니다. 현재 DFT 대체 재료 모델을 훈련하기 위한 가장 큰 오픈 소스 데이터 세트입니다.

2. OQMD 오픈 소스 양자 재료 데이터 세트

예상 크기:32.89GB

다운로드 주소:https://go.hyper.ai/qDyGS

OQMD 데이터 세트에는 밀도 함수 이론(DFT)을 통해 계산된 1,226,781개 이상의 재료의 열역학적 및 구조적 특성이 포함되어 있습니다. 이 데이터는 무기 결정 구조 데이터베이스(ICSD)에서 나온 것으로, 약 30만 개의 화합물에 대한 DFT 총 에너지 계산과 일반적인 결정 구조의 수정 내용을 포함하고 있으며, 양자 물질 데이터를 저장하고 공유하는 것을 목표로 합니다.

3. 재료 프로젝트 온라인 재료 데이터 세트

다운로드 주소:https://go.hyper.ai/ELmmX

재료 프로젝트는 대규모의 오픈 온라인 재료 데이터 세트입니다. 데이터에는 결정 구조, 에너지 특성, 전자 구조 및 열역학적 특성이 포함되어 있으며, 물질 표현, 광전자 특성, 기계적 특성, 물리화학적 특성, 안정성 및 반응성, 열역학적 특성 및 자기적 특성과 같은 여러 측면을 포괄합니다.

4. LLM4Mat-Bench 결정 구조 데이터 세트

다운로드 주소:https://go.hyper.ai/fSTbI

LLM4Mat-Bench는 재료 속성 예측을 위한 다중 모드 언어 모델 평가 데이터 세트입니다. 여기에는 10개의 공공 재료 데이터베이스에서 수집한 약 197만 개의 결정 구조 샘플이 포함되어 있으며, 45가지의 다양한 재료 물리적, 화학적 특성을 다루고 있습니다. 이는 물질적 속성 예측을 위한 대규모 언어 모델(LLM)의 성능을 평가하는 데 있어 현재까지 가장 큰 벤치마크입니다.

5. 재료 DFT 재료 속성 데이터 세트

다운로드 주소:https://go.hyper.ai/ju56p

이 데이터 세트는 다양한 화학적 구성과 물리적 특성을 포괄하는 Materials Project 데이터베이스의 수많은 고품질 재료 속성 기록을 제공합니다. 각 레코드는 고유한 재료에 해당하며, 모든 속성은 밀도 함수 이론(DFT) 계산을 통해 얻어집니다.

클래식 튜토리얼

HyperAI 공식 웹사이트는 고품질 데이터 외에도 원클릭 배포를 지원하는 "MatterGen 무기 물질 설계 모델 데모"를 출시하여 사용에 대한 문턱을 크게 낮췄습니다.

튜토리얼 주소:https://go.hyper.ai/5mWaL

MatterGen은 Microsoft에서 출시한 생성적 AI 기반 무기 재료 설계 모델로, 확산 모델을 통해 특정 화학적, 기계적, 전자적 또는 자기적 특성을 가진 새로운 재료를 직접 생성하는 것을 목표로 합니다.

구체적으로, MatterGen 모델은 주로 확산 아키텍처를 기반으로 합니다. 먼저 원자 유형, 원자 위치, 주기 격자를 점진적으로 파괴하여 무작위 구조를 만든 다음, 이 과정을 역으로 완료하도록 모델을 훈련시켜서 모델이 무작위 노이즈에서 점진적으로 원래 물질 구조를 복원하는 방법을 학습할 수 있도록 합니다. 논문의 책임저자인 셰톈(Xie Tian)은 이것이 비디오 생성의 핵심 아이디어와 매우 유사하다고 생각합니다.

위는 HyperAI가 수집한 물질 데이터 세트입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기고문을 제출하여 알려주세요!