16일 전
분자 그래프 강화 트랜스포머를 활용한 역합성 예측
{Junzhou Huang, Xi Xiao, Yu Rong, Tingyang Xu, Peilin Zhao, Kelong Mao}

초록
화학 분야에서 가능한 합성 경로가 막대하므로, 역합성 예측은 여전히 연구자들에게 도전 과제로 남아 있다. 최근 들어 역합성 예측은 기계 번역(Machine Translation, MT) 문제로 재정의되고 있다. 즉, 각 분자는 단순화된 분자 입력 선 입력 시스템(Simplified Molecular-Input Line-Entry System, SMILES) 문자열로 표현될 수 있으므로, 합성 과정은 반응물에서 생성물로의 언어 번역 과정과 유사하게 해석할 수 있다. 그러나 기존의 SMILES 데이터에 적용된 MT 모델들은 분자의 자연스러운 원자 간 결합 정보와 분자의 위상 구조를 무시하는 경향이 있다. 본 논문에서는 분자의 순차적 정보와 그래프적 정보를 모두 활용하는 그래프 강화 트랜스포머(Graph Enhanced Transformer, GET) 프레임워크를 제안한다. 본 연구에서는 SMILES 표현과 본 연구에서 개선한 그래프 신경망(Graph Neural Network, GNN)을 통해 학습된 원자 임베딩을 융합하는 네 가지 다양한 GET 설계를 제안한다. 실험 결과, 제안한 모델이 테스트 정확도에서 기존 트랜스포머 모델을 상당히 뛰어넘는 성능을 보였다.