HyperAIHyperAI
il y a 2 mois

MADGEN : Mass-Spec s'occupe de la génération moléculaire de novo

Wang, Yinkai ; Chen, Xiaohui ; Liu, Liping ; Hassoun, Soha
MADGEN : Mass-Spec s'occupe de la génération moléculaire de novo
Résumé

L'annotation (l'attribution d'identités chimiques structurales) des spectres MS/MS reste un défi majeur en raison de la diversité moléculaire considérable présente dans les échantillons biologiques et de la portée limitée des bases de données de référence. Actuellement, la grande majorité des mesures spectrales demeurent dans l'espace chimique « sombre » sans annotations structurales. Pour améliorer l'annotation, nous proposons MADGEN (Mass-spec Attends to De Novo Molecular GENeration), une méthode basée sur des échafaudages pour la génération de structures moléculaires de novo guidée par les données de spectrométrie de masse. MADGEN fonctionne en deux étapes : la recherche d'échafaudages et la génération moléculaire conditionnée aux spectres, à partir de l'échafaudage. Dans la première étape, étant donné un spectre MS/MS, nous formulons la recherche d'échafaudages comme un problème de classement et utilisons l'apprentissage contrastif pour aligner les spectres de masse avec les échafaudages moléculaires candidats. Dans la deuxième étape, à partir de l'échafaudage récupéré, nous utilisons le spectre MS/MS pour guider un modèle génératif basé sur l'attention afin de générer la molécule finale. Notre approche restreint l'espace de recherche pour la génération moléculaire, réduisant sa complexité et améliorant la précision de la génération. Nous évaluons MADGEN sur trois jeux de données (NIST23, CANOPUS et MassSpecGym) et analysons ses performances avec un récupérateur prédictif d'échafaudages et avec un récupérateur oraculaire. Nous démontrons l'efficacité de l'utilisation de l'attention pour intégrer les informations spectrales tout au long du processus de génération, permettant d'obtenir des résultats solides avec le récupérateur oraculaire.

MADGEN : Mass-Spec s'occupe de la génération moléculaire de novo | Articles de recherche récents | HyperAI