マルチモーダル分光法 (化学マルチモーダル分光法) は、IBM Research、チューリッヒ大学、EPFL、および NCCR Catalysis の研究チームによって 2024 年に作成されました。関連する論文の結果は「」です。分子構造の解明: 化学のためのマルチモーダル分光データセット」が NeurIPS に受理されました。
このデータセットには、特許データの化学反応から抽出された 790,000 個の分子のシミュレートされた 1H-NMR、13C-NMR、HSQC-NMR、赤外および質量分析 (正イオンおよび負イオン モード) のスペクトル データが含まれています。このデータセットの中核となる価値は、複数のスペクトルモダリティからの情報を統合し、人間の専門家が分子構造を分析する方法をシミュレートできることにあります。これにより、構造分析が自動化され、合成から構造決定までの分子発見プロセスが簡素化されることが期待されます。
このデータセットは、核磁気共鳴 (NMR)、赤外分光法、質量分析などの異なる分光技術間の相補性を考慮して構築されており、官能基の有無を含む分子構造について異なる視点を提供できます。この情報を組み合わせることで、研究者はより深い理解を得ることができます。これは、複数のスペクトル モダリティからの情報を統合できる AI/ML モデルを開発するために重要です。
さらに、マルチモーダル分光データセットは、構造解明、標的分子のスペクトル予測、官能基予測などの単一モダリティタスクを評価するためのベンチマークを提供します。これらのベンチマークは、モデルのパフォーマンスを評価するのに役立つだけでなく、将来の研究への明確な方向性も提供します。
做种 1
下载中 0
已完成 7
总下载 16