
초록
단백질 2차 구조(SS) 예측은 단백질 구조 및 기능 연구에 중요합니다. 입력 특징으로서 단백질 서열(프로필) 정보만을 사용할 때, 현재 가장 우수한 예측기들은 약 80%의 Q3 정확도를 얻을 수 있으며, 이는 지난 10년 동안 크게 개선되지 않았습니다. 본 연구에서는 단백질 SS 예측을 위한 DeepCNF (딥 컨볼루션 신경 필드)를 제시합니다. DeepCNF는 CRF (Conditional Random Fields)와 얕은 신경망을 통합한 CNF (Conditional Neural Fields)의 딥 러닝 확장입니다. DeepCNF는 깊은 계층적 구조를 통해 복잡한 서열-구조 관계뿐만 아니라 인접한 SS 라벨 간의 상호 의존성을 모델링할 수 있으므로, CNF보다 훨씬 강력합니다. 실험 결과, DeepCNF는 CASP 및 CAMEO 테스트 단백질에서 각각 약 84%의 Q3 정확도, 약 85%의 SOV 점수, 그리고 약 72%의 Q8 정확도를 얻을 수 있음을 보여주며, 현재 인기 있는 예측기들보다 크게 우수한 성능을 발휘하였습니다. 일반적인 프레임워크로서, DeepCNF는 접촉 수, 무질서 영역, 용매 접근성 등 다른 단백질 구조 속성 예측에도 활용될 수 있습니다.