Command Palette
Search for a command to run...
JIZHENG LI CHANGXIN FAN Hoi Ying LAU TIANYUE WU

초록
금속 결합 아미노산의 정확한 식별은 아연 손가락 단백질, 헤모글로빈, DNA 중합효소와 같은 금속 단백질 연구에 필수적이다. 실험적 방법은 높은 비용과 시간 소모가 크기 때문에, 계산 기반 예측 기법이 활용되고 있다. 그러나 기존의 계산 모델은 계산 복잡도가 높고, 고정된 아키텍처의 확장성이 부족하여 실제 적용에 어려움이 있었다. 본 연구에서는 단백질의 아연, 철, 마그네슘 결합 아미노산을 예측할 수 있는 두 단계(sequence 기반)의 딥러닝 프레임워크를 제안한다. 첫 번째 단계에서는 토큰화된 아미노산 서열을 독립적인 1차원 컨볼루션 신경망(CNN)으로 처리하여 개별 아미노산의 결합 확률 지도를 생성한다. 두 번째 단계에서는 경량화된 융합 네트워크가 이러한 확률 지도를 통합하여 금속 간 상호의존성을 모델링하고 예측을 보정한다. 본 프레임워크는 불균형 데이터에 대응하는 손실 함수와 앙상블 평가 기법을 활용하여 예측의 안정성과 신뢰성을 향상시켰다. 구조에 무관한 모듈러 설계를 통해 효율적인 학습 및 추론이 가능하며, 대규모 프로테오믹스 데이터의 라벨링에 적합한 특성을 지닌다.