HyperAI초신경

다중 모드 분광학 화학 다중 모드 스펙트럼 데이터 세트

날짜

6달 전

크기

9.7 GB

기관

* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

다중 모드 분광법(화학적 다중 모드 분광법)은 2024년 IBM Research, 취리히 대학교, EPFL 및 NCCR Catalysis의 연구팀에 의해 만들어졌습니다. 관련 논문 결과는 "분자 구조 풀기: 화학을 위한 다중 모드 분광 데이터 세트"라는 논문이 NeurIPS에 의해 승인되었습니다.

이 데이터 세트에는 특허 데이터의 화학 반응에서 추출한 790,000개 분자의 시뮬레이션된 1H-NMR, 13C-NMR, HSQC-NMR, 적외선 및 질량 분석(양이온 및 음이온 모드) 스펙트럼 데이터가 포함되어 있습니다. 이 데이터 세트의 핵심 가치는 여러 스펙트럼 모드에서 얻은 정보를 통합하고 인간 전문가가 분자 구조를 분석하는 데 사용하는 방법을 시뮬레이션하여 구조 분석을 자동화하고 합성에서 구조 결정까지 분자 발견 프로세스를 단순화하는 능력에 있습니다.

이 데이터 세트는 핵자기공명(NMR), 적외선 분광법, 질량 분석법 등 다양한 분광 기술 간의 상호 보완성을 고려하여 구성되었으며, 이를 통해 작용기의 존재 또는 부재를 포함하여 분자 구조에 대한 다양한 통찰력을 얻을 수 있습니다. 이러한 정보를 결합하면 연구자들은 더 깊은 이해를 얻을 수 있으며, 이는 여러 스펙트럼 모달리티의 정보를 통합할 수 있는 AI/ML 모델을 개발하는 데 중요합니다.

또한, 다중 모드 분광 데이터 세트는 구조 규명, 표적 분자의 스펙트럼 예측, 기능 그룹 예측과 같은 단일 모드 작업을 평가하기 위한 벤치마크도 제공합니다. 이러한 벤치마크는 모델의 성능을 평가하는 데 도움이 될 뿐만 아니라, 향후 연구에 대한 명확한 방향을 제공합니다.

데이터 개요

multimodal_spectroscopic_dataset.torrent
시딩 1다운로드 중 1완료됨 61총 다운로드 횟수 87
  • multimodal_spectroscopic_dataset/
    • README.md
      2.13 KB
    • README.txt
      4.27 KB
      • data/
        • multimodal_spectroscopic_dataset.zip
          9.7 GB