17일 전

그래프 및 트랜스포머 특징의 상호작용 융합을 통한 분자 특성 예측 성능 향상

M V Sai Prakash, Siddartha Reddy N, Ganesh Parab, Varun V, Vishal Vaddina, Saisubramaniam Gopalakrishnan
그래프 및 트랜스포머 특징의 상호작용 융합을 통한 분자 특성 예측 성능 향상
초록

분자 특성 예측은 계산 기반 약물 발견에서 핵심적인 과제이다. 최근 그래프 신경망(GNN)과 트랜스포머(Transformer)의 발전은 효과적이고 유망한 성과를 보여주었지만, 다음과 같은 한계를 가지고 있다. 트랜스포머의 자기주의(self-attention)는 분자의 기초 구조를 명시적으로 고려하지 않으며, GNN의 특징 표현만으로는 유사한 분자를 구분하는 데 필요한 미세하고 숨겨진 상호작용 및 특성을 충분히 포착하기 어렵다. 이러한 한계를 극복하기 위해, 본 연구에서는 GNN과 트랜스포머의 사전 훈련된 특징을 시너지적으로 결합하는 새로운 접근법인 SYN-FUSION을 제안한다. 이 방법은 분자의 전반적인 구조와 개별 원자 특성을 동시에 포착하는 포괄적인 분자 표현을 제공한다. MoleculeNet 벤치마크에서의 실험 결과는 SYN-FUSION이 7개 분류 데이터셋 중 5개와 6개 회귀 데이터셋 중 4개에서 기존 모델들을 능가함을 보여준다. 또한, 트랜스포머와 그래프 특징을 병합하여 공동 훈련한 다른 그래프-트랜스포머 모델들과의 성능 비교를 통해, 본 연구의 접근법이 동등한 수준의 성능을 달성함을 확인하였다. 손실 함수, 은닉 공간, 가중치 분포 등 다양한 측면에서 학습된 융합 모델에 대한 심층 분석을 통해 SYN-FUSION의 효과성은 더욱 강화된다. 마지막으로, 아블레이션(제거) 연구를 통해 SYN-FUSION이 개별 모델 구성 요소나 그 앙상블보다 뛰어난 시너지를 달성함을 명확히 입증하였으며, 분자 특성 예측 성능에 있어 상당한 개선을 제공함을 보였다.