HyperAI초신경

플로리다 대학교, 신경망을 사용하여 GPCR-G 단백질 결합 선택성 해독

일 년 전
정보
Yang Bai
特色图像

내용 한눈에 보기:G 단백질 결합 수용체(GPCR)는 세포막 외부의 자극을 세포막으로 전달하는 막관통 단백질로, 인간의 생리활동에 광범위하게 관여합니다. 최근 플로리다 대학의 연구자들은 GPCR과 G 단백질의 결합 선택성을 확인하고, 이 둘의 선택성을 예측하는 알고리즘을 개발했으며, 이 선택성의 구조적 기초를 연구했습니다.

키워드:GPCR 신경망 신약 개발

저자 | 쉐차이

편집자 | 산양

G 단백질 결합 수용체(GPCR)는 세포막 외부의 자극을 세포막 내부로 전달하는 막 단백질입니다. GPCR은 세포막의 G 단백질과 그 하위 신호 전달 경로를 활성화함으로써 발달, 면역, 호르몬 조절, 신경 활동과 같은 중요한 생리 활동에 광범위하게 관여할 수 있습니다.

G 단백질은 Gα, Gβ, Gγ 서브유닛으로 구성되며, 이들의 다양성은 GPCR 신호 반응의 다양성을 결정합니다. 인간 게놈은 16개의 Gα 서브유닛을 인코딩하는데, 이는 4개의 하위 패밀리로 나뉩니다.입출력 , Gα , Gα에스  그리고 Gα12/13 . G 단백질은 하위 신호 전달 경로를 결정하고, 이는 다시 세포 반응을 결정합니다. 따라서 GPCR과 G 단백질의 선택적 결합은 생물체의 신호전달 시스템을 이해하는 데 핵심이 됩니다.

학계에서는 한때 GPCR이 단일 G 단백질과만 결합한다고 믿었고, 따라서 GPCR을 기능에 따라 네 가지 유형으로 나누었습니다. 그러나 연구자들은 최근 대부분의 GPCR이 여러 G 단백질과 결합해 복잡한 세포 반응을 활성화한다는 사실을 발견했습니다. 일대일 분류 모델은 더 이상 GPCR과 G 단백질 간의 결합 관계를 설명하기에 충분하지 않지만, GPCR-G 단백질의 선택성 메커니즘은 아직 명확하지 않습니다.

이를 위해,플로리다 대학의 연구진은 운동 측정과 생물발광 공명 에너지 전달(BRET) 기술을 사용하여 GPCR의 구아닌 뉴클레오티드 교환 인자와 G 단백질의 선택적 결합을 분석했습니다. 이를 바탕으로 연구진은 G 단백질에 대한 선호도에 따라 GPCR을 분류하고 다양한 포유류의 124개 GPCR에 대한 개략적인 모델을 확립했습니다. 이후, GPCR-G 단백질 선택성을 예측하는 알고리즘이 개발되었고, 선택성의 구조적 기초가 조사되었습니다.관련 결과는 다음에서 발표되었습니다.셀 보고서".

이 결과는 "Cell Reports"에 게재되었습니다.

논문 링크:

https://doi.org/10.1016/j.celrep.2023.113173

01 BRET: GPCR-G 단백질 선택적 정량

GPCR-G 단백질 선택성을 정량화하기 위해 연구진은 BRET 기술을 사용하여 살아있는 세포에서 G 단백질 활동을 측정했습니다.

G 단백질 활동의 실시간 감지를 위한 BRET 기술

연구진은 콜레시스토키닌 II형 수용체(CCKBR)에서 이러한 결과를 검증했습니다. 반응 진폭의 결과는 CCKBR이 Gα를 활성화할 수 있음을 보여주었습니다.입출력 , Gα , Gα15  그리고 Gα12/13  이 가족의 G 단백질은 유사한 활성화 수준을 가지고 있지만 Gα를 활성화할 수 없습니다.에스  단백질 계열.

활성화율에 따른 결과는 CCKBR이 Gα에 중요한 영향을 미친다는 것을 명확히 보여줍니다.큐 가족의 활성화 효과가 가장 좋고, 그 다음으로 Gα 순이다.입출력 , Gα15 그리고 Gα12/13이는 활성화 속도 기반 BRET 기술이 다양한 G 단백질의 활동 간의 미묘한 차이를 포착할 수 있음을 보여줍니다.

진폭 기반 BRET 결과(C) 및 활성화율 기반 BRET 결과(D)

따라서,연구진은 이 연구를 위해 데이터 세트로 124개의 GPCR과 G 단백질의 선택성을 측정했습니다.

클래스 B GPCR 및 G 단백질의 선택성 측정

02 모델 구축: 이진 분류 신경망

위의 결과는 활성화 속도 기반 BRET 기술이 수백 개의 GPCR과 G 단백질 간의 선택성을 구별할 수 있음을 나타냅니다. 이 결과를 바탕으로,연구진은 클래스 A GPCR-G 단백질 선택성을 예측하기 위한 머신 러닝 기반 알고리즘을 개발했습니다.

알고리즘에는 두 가지 작업이 있습니다.

1. GPCR의 결합에 관하여, 특정 GPCR이 G단백질과 결합할 수 있는지, 즉 진폭이 0%보다 큰지 확인하십시오.

2. GPCR의 선택성과 관련하여, 특정 GPCR-G 단백질 커플은 빠르게 활성화될 수 있는 것으로 결정되었습니다. 즉, 활성화 속도는 >30%입니다.

머신 러닝 알고리즘의 개념도

각 GPCR과 다른 패밀리의 G 단백질 간의 결합은 분류 문제이므로, 각 작업은 5개의 이진 분류로 설계될 수 있습니다. 이를 바탕으로 연구진은 이러한 작업을 처리하기 위해 10개의 신경망 분류기를 설계했습니다. 신경망은 두 개의 완전 연결 층(각각 128개와 16개의 뉴런), 평탄화 층, 세 개의 완전 연결 층(각각 128개, 32개, 4개의 뉴런), 그리고 출력 층(1개의 뉴런)으로 구성됩니다. 내부 레이어는 ReLU(Rectified Linear Unit)에 의해 활성화되고 마지막으로 배치 정규화가 수행됩니다. 출력 계층은 시그모이드 함수에 의해 활성화됩니다.

데이터 양이 제한적이기 때문에 진화 과정에서 G 단백질 선택성을 결정하는 서열이 비교적 보존된다는 가정 하에 데이터 확장을 위해 각 GPCR에 50개의 상동 서열을 추가했습니다. 특정 환경에서 단백질 잔류물의 속성을 설명하기 위해 비지도 딥 러닝 모델을 사용하여 모델에 시퀀스 임베딩 프로토콜이 배포됩니다.

신경망의 입력은 B*30*1024 크기의 텐서입니다. 첫 번째 차원은 배치 크기(B=32)이고 두 번째 차원은 잔류물 수(30)이며 세 번째 차원은 각각에 대한 것입니다.아미노산 잔류물사전 훈련된 시퀀스 임베딩의 크기(1024).

진폭 및 활성화율에 대한 모델 예측 평균화 오록 둘 다 0.85로, 이는 모델이 두 지표를 모두 예측하는 데 좋은 성능을 보인다는 것을 나타냅니다.그 중에서도 G에 대한에스 패밀리 단백질은 각각 0.89와 0.95의 AUROC 값으로 가장 잘 예측되었습니다. 그러나 Gα의 경우15 그리고 Gα12/13 단백질 계열의 모델에서는 뚜렷한 학습 능력이 나타나지 않았습니다.

진폭(C) 및 활성화율(D) 예측을 위한 ROC 곡선

03 GPCRs-Gα 단백질 선택성 메커니즘 해독

BRET 실험과 머신 러닝은 GPCR-G 단백질 선택성의 구조적 기초를 해독하는 솔루션을 제공합니다. 이를 바탕으로 연구진은 이용 가능한 GPCR-G 단백질 복합체를 조사하고, 33개의 A 클래스 수용체를 분석하여 A 클래스 GPCR-Gα 단백질의 선택성을 결정하는 구조를 알아냈습니다.

연구진은 GPCR-Gα 단백질의 잔류물 네트워크를 조사한 결과, 세포질을 향한 GPCR의 모든 구조가 다양한 정도로 Gα 단백질과 결합하는 데 관여한다는 것을 발견했습니다. 마찬가지로, Gα 단백질에는 GPCR-Gα 단백질의 결합과 관련된 구조가 13개 있으며, 그 중 C 말단 α-나선(H5)이 가장 많이 관여합니다.

GPCR과 Gα 단백질의 다양한 구조적 요소 간의 상호작용

보편적인 GPCR-Gα 결합의 경우, GPCR은 ICL2, H8 및 대부분의 TM 잔기를 사용하여 Gα 단백질에 연결합니다. 그 중 대다수의 구조물은 주로 H5에 연결되어 있었고, ICL2는 더 광범위하게 연결되어 있었습니다.

GPCR과 Gα입출력  그리고 Gα  두 패밀리의 단백질 결합 패턴은 비슷하지만, 유일한 차이점은 전자에 대한 GPCR의 결합은 TM6에 크게 의존하는 반면, 후자에 대한 결합은 그렇지 않다는 것입니다. GPCR과 Gα에스  연결 중 ICL2와 ICL3의 비중이 크게 줄어들었고, TM3와 TM5에 대한 의존도가 더 높아졌습니다. 위의 결과는 다양한 Gα 단백질 계열의 경우 GPCR과의 연결이 서로 다른 구조에 따라 달라진다는 것을 보여줍니다.

또한, GPCR-G 단백질의 선택적 서열을 결합하여 다양한 패밀리의 Gα 단백질에 대한 특정 구조의 영향을 조사했습니다. 먼저 판단하고 Gα입출력 결합된 GPCR이 Gα에 결합할 수 있습니까?15 두 잔류물 네트워크의 차이점을 결합하고 비교합니다. 전자와 비교했을 때, 후자에 GPCR을 연결하면 ICL3와 H4의 결합이 끊어지고, ICL2-H5의 상호작용이 약해지고, TM4-HN과 ICL2-s2s3의 결합이 강화되었습니다. 이는 ICL2와 다른 잔류물 간의 연결이 Gα와 관련이 있을 수 있음을 시사합니다.입출력 또는 Gα15 연결된 GPCR의 주요 차이점.

GPCR은 Gα와만 상호 작용합니다.입출력 GPCR 및 Gα에 연결된 잔류물 네트워크15/Gα입출력 연결된 잔류물 네트워크(K)

마찬가지로 GPCR과 Gα에스  그리고 Gα입출력  잔류물 네트워크를 결합한 결과, 두 가지의 주요 차이점은 ICL1과 TM5 간의 연결인 것으로 나타났습니다.

위의 결과는 다음을 보여줍니다.BRET와 머신 러닝은 GPCR-G 단백질 결합의 단백질 잔류물 네트워크를 분석하고 선택성의 구조적 기초를 찾아 GPCR 연구를 위한 새로운 방법을 제공합니다.

04 AI-GPCR: 96.4%의 미탐사 영역

지난 10년 동안 GPCR 분야에서 AI와 머신러닝 응용 프로그램의 비중은 꾸준히 증가했습니다. 2022년에는 GPCR 관련 논문 3.6%에서 AI 관련 방법이 언급되었습니다.

GPCR 관련 논문에서 언급된 AI의 비율

GPCR 약물 연구에 AI가 점점 더 많이 적용됨에 따라, 이에 상응하는 알고리즘도 개발되고 있습니다. 분류 문제의 경우 가장 일반적으로 사용되는 알고리즘은 SVM(지원 벡터 머신), 의사결정 트리, 그래디언트 부스팅 머신, k-최근접 이웃 알고리즘을 포함한 scikit-learn 라이브러리와 같은 기존 머신 러닝 알고리즘입니다.

단백질-리간드 결합의 친화도와 같은 수치적 결과의 경우, 다변수 선형 회귀, 지원 벡터 머신, 딥 러닝 네트워크와 같은 회귀 알고리즘을 사용하여 문제를 해결하는 경우가 많습니다.

최근 결과는 주로 예측을 위해 다층 퍼셉트론과 합성곱 신경망(CNN)과 같은 딥러닝 알고리즘을 사용합니다. 딥러닝 생성 알고리즘의 개발로 단백질 리간드와 구조 설계가 더욱 효율적이고 정확해졌습니다. 생성적 적대 신경망(GAN), 순환 신경망(RNN), 강화 학습과 같은 알고리즘은 벡터 공간의 자동 구성과 적응적 측정을 사용하여 더 큰 생성 공간을 탐색할 수 있습니다.

GPCR 약물 개발의 각 단계에서 AI의 역할

따라서 이러한 알고리즘은 원하는 기능을 가진 더 많은 리간드를 생성하거나 예를 들어 알려지지 않은 단백질의 구조를 보다 정확하게 예측할 수 있습니다. 알파폴드2 . AlphaFold2와 같은 모델은 GPCR의 구조를 예측하도록 특별히 설계된 것은 아니지만 여전히 GPCR의 구조를 효율적이고 정확하게 예측할 수 있습니다. 또한, 비지도 학습이나 자기 지도 학습도 약물 발견에 활용되고 있습니다.

AI-GPCR이 미래 약물 개발의 새로운 방향이 될 수 있음을 알 수 있지만, 96.4%의 알려지지 않은 영역도 남았습니다. 효율적인 분류와 정확한 예측 알고리즘의 도움으로 사람들은 GPCR의 결합 메커니즘을 더 명확하게 이해할 수 있었고, 이는 생물의학 발전에 새로운 자극을 주었습니다.