HyperAI

Ensemble De Données Spectroscopiques Chimiques Multimodales

Date

il y a 6 mois

Taille

9.7 GB

Organisation

URL de publication

rxn4chemistry.github.io

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

Multimodal Spectroscopic (Chemical Multimodal Spectroscopy) a été créé en 2024 par une équipe de recherche d'IBM Research, de l'Université de Zurich, de l'EPFL et du NCCR Catalysis. Les résultats de l'article connexe sont «Décrypter la structure moléculaire : un ensemble de données spectroscopiques multimodales pour la chimie", qui a été accepté par NeurIPS.

L'ensemble de données contient des données spectrales simulées de 1H-RMN, 13C-RMN, HSQC-RMN, infrarouge et de spectrométrie de masse (modes ions positifs et négatifs) de 790 000 molécules extraites de réactions chimiques dans les données de brevets. La valeur fondamentale de cet ensemble de données réside dans sa capacité à intégrer des informations provenant de multiples modalités spectrales et à simuler les méthodes utilisées par les experts humains pour analyser les structures moléculaires, automatisant ainsi l'analyse structurelle et simplifiant le processus de découverte moléculaire, de la synthèse à la détermination de la structure.

L'ensemble de données a été construit en tenant compte de la complémentarité entre différentes techniques spectroscopiques, telles que la résonance magnétique nucléaire (RMN), la spectroscopie infrarouge et la spectrométrie de masse, qui peuvent fournir différentes informations sur la structure moléculaire, y compris la présence ou l'absence de groupes fonctionnels. En combinant ces informations, les chercheurs peuvent acquérir une compréhension plus approfondie, ce qui est essentiel pour développer des modèles d’IA/ML capables d’intégrer des informations provenant de plusieurs modalités spectrales.

De plus, l'ensemble de données spectroscopiques multimodales fournit également une référence pour l'évaluation des tâches à modalité unique telles que l'élucidation de la structure, la prédiction spectrale des molécules cibles et la prédiction des groupes fonctionnels. Ces repères permettent non seulement d’évaluer les performances des modèles, mais fournissent également des orientations claires pour les recherches futures.

Aperçu des données

multimodal_spectroscopic_dataset.torrent
Partage 1Téléchargement 1Terminés 61Téléchargements totaux 87
  • multimodal_spectroscopic_dataset/
    • README.md
      2.13 KB
    • README.txt
      4.27 KB
      • data/
        • multimodal_spectroscopic_dataset.zip
          9.7 GB