Command Palette
Search for a command to run...
{Mingyue Zheng Hualiang Jiang Kaixian Chen Xiaomin Luo Tianbiao Yang Xiaohong Liu Feisheng Zhong Dingyan Wang Xiaoqin Tan Lifan Chen}
초록
동기약물 탐색 및 화학유전체학 연구에서 복합체-단백질 상호작용(CPI)을 식별하는 것은 핵심적인 과제이며, 3차원 구조가 알려지지 않은 단백질은 잠재적인 생물학적 타겟의 대다수를 차지한다. 이에 따라 단백질 서열 정보만을 이용해 CPI를 예측할 수 있는 방법 개발이 필수적이다. 그러나 서열 기반의 CPI 모델은 부적절한 데이터셋 사용, 숨겨진 리간드 편향, 데이터셋의 부적절한 분할과 같은 특정한 함정에 직면할 수 있으며, 이로 인해 모델의 예측 성능이 과대평가될 수 있다.결과이러한 문제를 해결하기 위해 본 연구에서는 CPI 예측을 위한 새로운 데이터셋을 구축하였으며, 새로운 트랜스포머 신경망인 TransformerCPI를 제안하고, 모델이 진정한 상호작용 특징을 학습하였는지 검증하기 위해 더 엄격한 레이블 역전 실험을 도입하였다. TransformerCPI는 새로운 실험에서 향상된 성능을 보였으며, 단백질 서열과 화합물 원자에서 중요한 상호작용 영역을 분해하여 강조할 수 있는 능력을 지니고 있다. 이러한 특성은 향후 리간드 구조 최적화를 위한 화학생물학 연구에 유용한 지침을 제공할 수 있다.
벤치마크
| 벤치마크 | 방법론 | 지표 |
|---|---|---|
| drug-discovery-on-bindingdb | TransformerCPI | AUC: 0.937 |
| drug-discovery-on-lit-pcba-aldh1 | TransformerCPI | AUC: 0.694 |
| drug-discovery-on-lit-pcba-esr1-ant | TransformerCPI | AUC: 0.616 |
| drug-discovery-on-lit-pcba-kat2a | TransformerCPI | AUC: 0.650 |
| drug-discovery-on-lit-pcba-mapk1 | TransformerCPI | AUC: 0.683 |