11일 전
GCBLANE: 전사 인자 결합 부위 예측을 위한 그래프 강화형 컨볼루션 BiLSTM 어텐션 네트워크
Jonas Chris Ferrao, Dickson Dias, Sweta Morajkar, Manisha Gokuldas Fal Dessai

초록
전사 인자 결합 부위(TFBS)를 식별하는 것은 전사 인자(TF)가 DNA에 결합하여 유전자 발현을 조절할 수 있도록 해주기 때문에 유전자 조절을 이해하는 데 핵심적인 과제이다. 고속 시퀀싱 기술의 발전에도 불구하고, 방대한 게놈 데이터와 복잡한 결합 패턴으로 인해 정확한 TFBS 식별은 여전히 도전 과제로 남아 있다. 본 연구에서는 그래프 기반 강화(convolutional, multi-head attention, recurrent) 구조를 통합한 그래프 신경망(GNN)을 활용한 그래프 기반 컨볼루션 양방향 Long Short-Term Memory(LSTM) 어텐션 네트워크(GCBLANE)를 제안한다. 이 모델은 TFBS 예측을 위한 핵심 특징을 효과적으로 탐지하기 위해 컨볼루션 계층, 멀티헤드 어텐션 계층, 순환 계층과 그래프 신경망을 융합한다. 690개의 ENCODE ChIP-Seq 데이터셋에서 GCBLANE는 평균 AUC 0.943을 달성하였으며, 165개의 ENCODE 데이터셋에서는 AUC 0.9495를 기록하여, DNA 형태 정보를 포함한 다중 모달(multimodal) 접근 방식을 활용하는 최신 모델들을 모두 상회하였다. 이 결과는 GCBLANE가 기존의 다른 방법들에 비해 뛰어난 성능을 보임을 입증한다. 그래프 기반 학습과 시퀀스 분석을 결합함으로써, GCBLANE는 TFBS 예측 기술의 발전에 중요한 기여를 한다.