4ヶ月前

機械学習を用いたテラスケールの質量分析データの解読による有機反応の発見

Konstantin S. Kozlov, Daniil A. Boiko, Julia V. Burykina, Valentina V. Ilyushenkova, Alexander Y. Kostyukovich, Ekaterina D. Patil, Valentine P. Ananikov
機械学習を用いたテラスケールの質量分析データの解読による有機反応の発見
要約

科学界の大規模データセットの蓄積は、従来の処理方法の能力を上回り、広大な既存の実験データを効率的に探索できる革新的かつ効率的なアルゴリズムの必要性を強調しています。この課題に対応するため、当研究ではテラスケール高解像度質量分析(HRMS)データの解析に特化した機械学習(ML)を活用した検索エンジンを導入します。このエンジンは、新たな同位体分布を中心とした検索アルゴリズムと、2つの相乗効果を持つMLモデルによって強化されており、これまで未知であった化学反応の発見を支援します。この手法により、既存データの厳密な調査が可能となり、化学的仮説を効率的にサポートしながら追加実験の必要性を軽減することができます。さらに、当研究では自動的な反応仮説生成のための基準手法も拡張しています。実践的な検証において、当手法は複数の反応を成功裏に特定し、以前に記述されていなかった変換過程を明らかにしました。その中でも特に注目すべきは、ミゾロキ-ヘック反応内のヘテロサイクル-ビニルカップリングプロセスで、このエンジンが複雑な化学現象を解明する能力を示しています。