2달 전

MassSpecGym: 분자 발견 및 식별을 위한 벤치마크

Roman Bushuiev; Anton Bushuiev; Niek F. de Jonge; Adamo Young; Fleming Kretschmer; Raman Samusevich; Janne Heirman; Fei Wang; Luke Zhang; Kai Dührkop; Marcus Ludwig; Nils A. Haupt; Apurva Kalia; Corinna Brungs; Robin Schmid; Russell Greiner; Bo Wang; David S. Wishart; Li-Ping Liu; Juho Rousu; Wout Bittremieux; Hannes Rost; Tytus D. Mak; Soha Hassoun; Florian Huber; Justin J.J. van der Hooft; Michael A. Stravs; Sebastian Böcker; Josef Sivic; Tomáš Pluskal
MassSpecGym: 분자 발견 및 식별을 위한 벤치마크
초록

생물학적 및 환경 샘플에서 분자의 발견과 식별은 생의약 및 화학 과학의 발전에 필수적입니다. 중합체 질량분석법(MS/MS)은 분자 구조의 고속 해독을 위한 주요 기술입니다. 그러나 인간 전문가가 수행하더라도 질량 스펙트럼으로부터 분자 구조를 해독하는 것은 매우 어려운 작업입니다. 그 결과, 대부분의 획득된 MS/MS 스펙트럼이 해석되지 않은 채로 남아 있어, 근본적인 (생)화학 과정에 대한 이해를 제한하고 있습니다. MS/MS 스펙트럼으로부터 분자 구조를 예측하기 위한 머신 러닝 응용 프로그램의 수십 년간의 진전에도 불구하고, 새로운 방법의 개발은 표준 데이터셋과 평가 프로토콜 부족으로 심각하게 제약받고 있습니다. 이 문제를 해결하기 위해, 우리는 MassSpecGym -- MS/MS 데이터로부터 분자를 발견하고 식별하는 첫 번째 포괄적인 벤치마크를 제안합니다. 우리의 벤치마크는 가장 큰 공개적으로 이용 가능한 고품질 라벨링된 MS/MS 스펙트럼 컬렉션을 포함하며, 세 가지 MS/MS 주석 도전 과제를 정의합니다: de novo 분자 구조 생성, 분자 검색, 그리고 스펙트럼 시뮬레이션. 또한 새로운 평가 지표와 일반화 요구 데이터 분할을 포함하여, MS/MS 주석 작업을 표준화하고 광범위한 머신 러닝 커뮤니티에게 접근 가능하도록 만듭니다. MassSpecGym은 https://github.com/pluskal-lab/MassSpecGym에서 공개적으로 이용 가능합니다.

MassSpecGym: 분자 발견 및 식별을 위한 벤치마크 | 최신 연구 논문 | HyperAI초신경