HyperAIHyperAI
vor 2 Monaten

MassSpecGym: Eine Referenz für die Entdeckung und Identifizierung von Molekülen

Roman Bushuiev; Anton Bushuiev; Niek F. de Jonge; Adamo Young; Fleming Kretschmer; Raman Samusevich; Janne Heirman; Fei Wang; Luke Zhang; Kai Dührkop; Marcus Ludwig; Nils A. Haupt; Apurva Kalia; Corinna Brungs; Robin Schmid; Russell Greiner; Bo Wang; David S. Wishart; Li-Ping Liu; Juho Rousu; Wout Bittremieux; Hannes Rost; Tytus D. Mak; Soha Hassoun; Florian Huber; Justin J.J. van der Hooft; Michael A. Stravs; Sebastian Böcker; Josef Sivic; Tomáš Pluskal
MassSpecGym: Eine Referenz für die Entdeckung und Identifizierung von Molekülen
Abstract

Die Entdeckung und Identifizierung von Molekülen in biologischen und umweltbezogenen Proben ist entscheidend für den Fortschritt der biomedizinischen und chemischen Wissenschaften. Tandem-Massenspektrometrie (MS/MS) ist die führende Technik zur hochdurchflussfähigen Aufklärung von Molekülstrukturen. Dennoch ist das Dekodieren einer Molekülstruktur aus ihrem Massenspektrum äußerst herausfordernd, selbst wenn es von menschlichen Experten durchgeführt wird. Daher bleiben die meisten erworbenen MS/MS-Spektren uninterpretiert, was unser Verständnis der zugrunde liegenden (Bio-)chemischen Prozesse einschränkt. Trotz Jahrzehnten des Fortschritts bei der Anwendung maschinellen Lernens zur Vorhersage von Molekülstrukturen aus MS/MS-Spektren wird die Entwicklung neuer Methoden durch den Mangel an Standard-Datensätzen und Bewertungsprotokollen stark behindert. Um dieses Problem anzugehen, schlagen wir MassSpecGym vor – den ersten umfassenden Benchmark für die Entdeckung und Identifizierung von Molekülen aus MS/MS-Daten. Unser Benchmark besteht aus der größten öffentlich verfügbaren Sammlung hochwertiger gekennzeichneter MS/MS-Spektren und definiert drei MS/MS-Annotationsausforderungen: de-novo-Molekülstrukturerzeugung, Molekülsuche und Spektrumsimulation. Er enthält neue Bewertungsmaße und eine Datenaufteilung, die allgemeine Verallgemeinerung fordert, wodurch die MS/MS-Annotationssaufgaben standardisiert werden und das Problem für die breite maschinelle Lerncommunity zugänglich gemacht wird. MassSpecGym ist öffentlich verfügbar unter https://github.com/pluskal-lab/MassSpecGym.

MassSpecGym: Eine Referenz für die Entdeckung und Identifizierung von Molekülen | Neueste Forschungsarbeiten | HyperAI