2ヶ月前

MADGEN: マススペクトルがデノボ分子生成に注目する

Wang, Yinkai ; Chen, Xiaohui ; Liu, Liping ; Hassoun, Soha
MADGEN: マススペクトルがデノボ分子生成に注目する
要約

MS/MSスペクトルの注釈(構造的化学的同一性の割り当て)は、生物学的サンプルにおける莫大な分子多様性と参照データベースの限られた範囲により、依然として大きな課題となっています。現在、大部分のスペクトル測定が「暗黙の化学空間」にあり、構造的な注釈が付いていない状況です。この課題を改善するために、我々はMADGEN(Mass-spec Attends to De Novo Molecular GENeration)を提案します。これは、質量分析データによってガイドされるデノボ分子構造生成のための骨組みベースの手法です。MADGENは2つの段階で動作します:骨組み検索とスペクトル条件付き分子生成。第1段階では、MS/MSスペクトルが与えられた場合、骨組み検索をランキング問題として定式化し、対照学習を使用して質量スペクトルと候補となる分子骨組みを合わせます。第2段階では、取得された骨組みから開始し、MS/MSスペクトルを使用して注意に基づく生成モデルをガイドし、最終的な分子を生成します。当手法は分子生成探索空間を制約することで、その複雑さを軽減し、生成精度を向上させます。我々はMADGENを3つのデータセット(NIST23, CANOPUS, および MassSpecGym)で評価し、予測的な骨組み検索器とオラクル検索器を使用してMADGENの性能を評価しました。結果として、生成プロセス全体でスペクトル情報を統合するために注意を使用することにより、オラクル検索器での強力な結果を得ることができることを示しています。

MADGEN: マススペクトルがデノボ分子生成に注目する | 最新論文 | HyperAI超神経