2달 전

DeepAffinity: 통합된 순환 신경망과 합성곱 신경망을 이용한 화합물-단백질 친화성의 해석 가능한 딥 러닝

Mostafa Karimi; Di Wu; Zhangyang Wang; Yang Shen
DeepAffinity: 통합된 순환 신경망과 합성곱 신경망을 이용한 화합물-단백질 친화성의 해석 가능한 딥 러닝
초록

동기: 약물 발굴은 화합물-단백질 상호작용(CPI)의 신속한 정량화를 요구합니다. 그러나, 시퀀스만으로 화합물-단백질 친화성을 높은 적용성, 정확성, 해석 가능성과 함께 예측할 수 있는 방법이 부족합니다.결과: 우리는 도메인 지식과 학습 기반 접근법을 원활하게 통합하였습니다. 구조적으로 주석이 달린 단백질 시퀀스의 새로운 표현 방식 하에서, 라벨이 붙지 않은 데이터와 라벨이 붙은 데이터를 모두 활용하기 위해 순환 신경망(RNN)과 합성곱 신경망(CNN)을 통합한 반감독 딥러닝 모델을 제안하였습니다. 이 모델은 분자 표현을 공동 인코딩하고 친화성을 예측하는 데 사용됩니다. 우리의 표현 방식과 모델은 테스트 사례에서는 IC$_{50}$ 상대 오차를 5배 이내로, 훈련에 포함되지 않은 단백질 클래스에서는 20배 이내로 줄이는 데 있어 기존 옵션들을 능가합니다. 전이 학습을 통해 적은 수의 라벨된 데이터를 가진 새로운 단백질 클래스의 성능도 더욱 개선되었습니다. 또한, 선택적인 약물-타겟 상호작용을 예측하고 설명하는 사례 연구에서 보듯이, 별도의 주의 메커니즘과 공동 주의 메커니즘이 개발되어 모델에 내장되어 해석 가능성을 추가하였습니다. 마지막으로, 단백질 시퀀스나 화합물 그래프를 사용한 대체 표현 방식과 그래프 합성곱 신경망(GCNN)을 이용한 통합 RNN/GCNN-CNN 모델도 탐구하여 앞으로의 알고리즘적 과제를 밝혔습니다.사용 가능 정보: 데이터와 소스 코드는 https://github.com/Shen-Lab/DeepAffinity 에서 제공됩니다.보충 정보: 보충 자료는 http://shen-lab.github.io/deep-affinity-bioinf18-supp-rev.pdf 에서 제공됩니다.

DeepAffinity: 통합된 순환 신경망과 합성곱 신경망을 이용한 화합물-단백질 친화성의 해석 가능한 딥 러닝 | 최신 연구 논문 | HyperAI초신경