2ヶ月前

Diffusion言語モデルを用いたテキストガイダンスによる分子生成

Haisong Gong; Qiang Liu; Shu Wu; Liang Wang
Diffusion言語モデルを用いたテキストガイダンスによる分子生成
要約

テキストガイダンスによる分子生成は、特定のテキスト記述に適合する分子を生成するタスクです。最近では、既存のSMILESベースの分子生成手法の多くが自己回帰型アーキテクチャに依存しています。本研究では、自己回帰型手法の制限を克服するために、拡散モデルを活用した新しいアプローチである「テキストガイダンスによる分子生成と拡散言語モデル(TGM-DLM)」を提案します。TGM-DLMは、SMILES文字列内のトークン埋め込みを集合的にかつ反復的に更新し、2段階の拡散生成プロセスを使用します。第1段階では、テキスト記述によって誘導されるランダムノイズから埋め込みを最適化し、第2段階では無効なSMILES文字列を有効な分子表現に修正します。我々は、追加のデータリソースなしでTGM-DLMが自己回帰型モデルであるMolT5-Baseを上回ることを示しました。これらの結果は、特定の特性を持つ一貫性と精度のある分子を生成する際のTGM-DLMの優れた効果性を強調しており、薬物発見や関連科学分野における新たな道を開く可能性があります。コードは以下のURLで公開されます: https://github.com/Deno-V/tgm-dlm.

Diffusion言語モデルを用いたテキストガイダンスによる分子生成 | 最新論文 | HyperAI超神経