2ヶ月前
分子グラフと自然言語を関連付ける多様なモーダル基盤モデル
Bing Su; Dazhao Du; Zhao Yang; Yujie Zhou; Jiangmeng Li; Anyi Rao; Hao Sun; Zhiwu Lu; Ji-Rong Wen

要約
人工知能(AI)は、幅広い分野で分子の理解に大きな進歩を遂げていますが、既存のモデルは一般的に単一の分子モダリティから単一の認知能力を獲得しています。分子知識の階層構造は深く、人間ですら直感的な図や専門的なテキストなど異なるモダリティから学習することで理解を補助します。この点に着想を得て、我々は対照学習を通じて分子グラフとその意味的に関連するテキストデータ(公開された科学引用索引論文からクロールしたデータ)から事前学習された分子多モダル基盤モデルを提案します。このAIモデルは、分子グラフと自然言語を直接橋渡す重要な試みを表しています。特に、両モダリティの特定かつ相補的な情報を捉えることで、我々が提案するモデルはより良い分子に関する専門知識を掌握することができます。実験結果は、クロスモーダル検索や分子キャプション生成などのクロスモーダルタスクにおいて有望な性能を示すだけでなく、分子特性予測も向上し、自然言語記述から意味のある分子グラフを生成する能力を持つことを示しています。我々は、本モデルが生物学、化学、材料科学、環境科学、医学など様々な分野におけるAI活用に広範な影響を与えると考えています。