11일 전

DLPAlign: 다중 단백질 서열을 위한 딥러닝 기반 점진적 정렬 방법

{Lufei Gao, Yong liu, Mengmeng Kuang}
초록

본 논문은 점진적 다중 단백질 서열 정렬 방법의 정확도를 향상시키기 위한 새로운이고 간단한 접근법을 제안한다. 우리는 합성곱 신경망(Convolutional Neural Networks)과 양방향 장단기 기억망(Bi-directional Long Short-Term Memory Networks) 기반의 의사결정 모델을 학습시켜, 다양한 사후 확률 행렬을 계산함으로써 입력 단백질 서열을 점진적으로 정렬하였다.이 방법의 성능을 평가하기 위해, BAliBASE, OXBench, SABMark 세 가지 실증적 정렬 벤치마크를 대상으로 11개의 선도적인 정렬 방법과 비교할 수 있도록 다중 서열 정렬 도구인 DLPAlign을 구현하였다. 그 결과, DLPAlign은 세 벤치마크에서 모두 최고의 전체 열 점수(total-column scores)를 기록하였다. 특히 평균 PID ≤ 30%인 711개의 저유사도 서열 가족에 대해 평가한 결과, DLPAlign은 두 번째로 우수한 MSA 소프트웨어보다 약 2.8% 향상된 성능을 보였다. 또한, 코로나19 바이러스(SARS-CoV-2)와 관련된 네 개의 단백질 서열을 대상으로 단백질 2차 구조 예측이라는 실제 응용 사례에서 DLPAlign과 다른 정렬 도구의 성능을 비교한 결과, DLPAlign은 모든 경우에서 최고의 결과를 제공하였다.

DLPAlign: 다중 단백질 서열을 위한 딥러닝 기반 점진적 정렬 방법 | 최신 연구 논문 | HyperAI초신경