4ヶ月前

G2GT: グラフ対グラフ注意ニューラルネットワークと自己学習を用いた逆合成予測

Zaiyun Lin; Shiqiu Yin; Lei Shi; Wenbiao Zhou; YingSheng Zhang
G2GT: グラフ対グラフ注意ニューラルネットワークと自己学習を用いた逆合成予測
要約

逆合成予測は有機化学および関連分野における基本的な課題の一つです。この課題の目的は、製品分子を合成することができる反応物分子を見つけることです。本研究では、標準的なトランスフォーマー構造に基づいてグラフエンコーダとグラフデコーダを構築した新しいグラフ対グラフ変換モデル(G2GT)を提案します。さらに、ラベルの付いていない分子データを利用する強力なデータ拡張手法である自己学習が、モデルの性能を大幅に向上させることを示しています。反応タイプラベルとアンサンブル学習に着想を得て、多様性を向上させる新たな弱いアンサンブル手法を提案しました。ビームサーチ、ヌクレウスサンプリング、トップ-kサンプリング手法を組み合わせることで推論の多様性をさらに向上させ、最終的に上位10件の結果を選択するための単純なランキングアルゴリズムも提案しました。USPTO-50Kデータセットにおいてトップ1精度54%、より大規模なUSPTO-fullデータセットにおいてトップ1精度50%という新たな最先端の結果を達成し、上位10件の結果でも競争力のある成績を収めました。

G2GT: グラフ対グラフ注意ニューラルネットワークと自己学習を用いた逆合成予測 | 論文 | HyperAI超神経