要約
分子性質予測は、生物学的実験に比べて実験効率が高いため、AIを活用したドラッグデザインにおいて極めて重要である。グラフニューラルネットワーク(GNN)が多数の分野で著しい成果を上げていることから、いくつかの研究では分子性質予測にGNNを適用し、分子をグラフとして扱うアプローチが採られている。この場合、分子内の原子はグラフのノード、結合はエッジとして定義される。しかし、既存の多くの手法は、ドメイン固有の知識を考慮せずに一般的なグラフニューラルネットワークを単純に適用している。化学情報は分子の機能と密接に関連しており、正確な性質予測にはこれを活用することが不可欠である。そこで本研究では、分子のサブ構造の存在・非存在を示す分子フィンガープリントを統合することで、化学情報を活用した分子表現学習を実現した。提案手法を複数の強力なベースラインと比較した結果、本手法は他の手法を大きく上回ることが明らかになった。現在までに、本手法はOpen Graph Benchmark(OGB)の「ogbg-molhiv」タスクにおいて、リーダーボードで1位を維持している。