16일 전

TrimNet: 생물의학을 위한 삼중 메시지에서 학습하는 분자 표현

{Xiaojun Yao, Sen Song, Huanxiang Liu, Xianggen Liu, Shengyu Zhang, Chang-Yu Hsieh, Yuquan Li, Pengyong Li}
초록

동기: 계산 기반 방법은 약물 발견을 가속화하며, 분자 특성 예측 및 화합물-단백질 상호작용 식별과 같은 생의학 분야에서 중요한 역할을 한다. 핵심 과제는 유용한 분자 표현을 학습하는 것이다. 초기에는 분자 특성을 양자역학적 방법으로 계산하거나 전통적인 기계학습 기법으로 예측하는 방식이 주로 사용되었으나, 이는 전문 지식이 필요하고 종종 인적 노력이 큰 작업이었다. 최근에는 그래프 신경망(GNN)이 그래프 데이터로부터 표현을 학습할 수 있는 강력한 능력으로 인해 큰 주목을 받고 있다. 그러나 현재의 그래프 기반 방법은 대규모 파라미터와 결합 정보 추출 부족 등의 한계를 가지고 있어 해결이 필요하다.결과: 본 연구에서는 새로운 삼중 메시지 메커니즘을 도입하여 분자 표현을 효율적으로 학습하는 그래프 기반 접근법을 제안하였으며, 이를 트리플릿 메시지 네트워크(TrimNet)라 명명하였다. TrimNet이 양자 특성, 생물활성, 생리학적 특성, 그리고 화합물-단백질 상호작용(CPI) 예측을 포함한 다양한 분자 표현 학습 과제에서 뛰어난 정확도를 보이며, 파라미터 수를 크게 감소시킬 수 있음을 입증하였다. 실험 결과, 다양한 데이터셋에서 기존 최고 성능 기법을 크게 앞서는 성능을 기록하였다. 적은 파라미터 수와 높은 예측 정확도 외에도, TrimNet은 목표 특성에 핵심적인 원자에 주목할 수 있어 예측 과제에 대한 명확한 해석 가능성을 제공한다. 이러한 장점들은 TrimNet이 분자 표현 학습이라는 도전적인 문제 해결을 위한 강력하고 유용한 계산 도구로 자리매김하게 만들었다.