HyperAI초신경

상하이 교통대학교의 빙신 저우 박사: 희소한 생물학적 데이터 문제를 해결하고 그래프 신경망을 통해 단백질 이해와 생성을 재구성합니다.

特色图像

8월 12일, 상하이 교통대학교 생명공학 AI 여름학교가 정식으로 개교하여, 국내외 30여 개 대학과 27개 기업에서 온 100여 명의 업계 관계자가 참석했습니다. 3일간의 학습 및 교류 기간 동안 많은 업계 전문가, 기업 대표 및 뛰어난 젊은 학자들이 참여했습니다.AI와 생명공학의 통합과 혁신적 개발에 대한 심도 있는 공유가 이루어졌습니다.

12일 오전, 상하이 교통대학 자연과학연구소 겸 상하이 국가응용수학센터(상하이 교통대학 분원)의 주빙신 연구원이 "인공지능의 과거와 현재"라는 주제로 강연했습니다. AI의 발전 역사를 생생하게 정리하고, 마일스톤 모델의 특징을 요약했습니다.

오후에는 "인공지능의 최전선 진보"에 대한 객원 전문가 보고에서 주빙신 박사가 "그래프 신경망과 단백질 구조 표현"이라는 주제로 발표를 진행했습니다. 우리는 단백질 예측 및 생성과 같은 분야에서 그래프 신경망의 정의, 장점, 최첨단 응용 프로그램을 모든 사람과 공유했습니다. HyperAI는 이 주제에 대한 주빙신 박사의 연설을 원래 의도를 훼손하지 않고 편집하고 요약했습니다. 다음은 연설 전문입니다.

수십 년간의 급속한 발전 끝에 딥 러닝은 합성곱 신경망, 순환 신경망, 트랜스포머 등 다양한 모델을 만들어냈으며, 이를 통해 다양한 특성을 가진 데이터를 처리할 수 있습니다. 그 중 그래프 신경망은 구조적 데이터를 입력하고 처리할 수 있기 때문에 소셜 네트워크, 궤적 예측, 분자 모델링 등 다양한 시나리오에서 널리 사용됩니다.

그러나 많은 사람들은 그래프 신경망이 그래프 합성곱 네트워크(GCN)이므로 복잡한 함수에 적합하지 않고 여러 층을 쌓으면 지나치게 평활화되는 문제가 발생할 수 있으며 많은 제한이 있다고 생각합니다. 또한, 대규모 Transformer 기반 모델은 대규모 데이터 세트에 대한 강력한 학습 기능을 갖추고 있기 때문에그렇다면 왜 우리는 그래프 신경망에 대한 연구와 개발을 계속하는 것일까요?

이런 질문에 대한 제 대답은 "섹시하거든요"로 요약할 수 있습니다.

첫 번째 "S"는 그래프 신경망 기반 연구가 건강하고 지속 가능하다는 것입니다. 아래 그림에서 보듯이, 다양한 인간 행동에 따른 탄소 소비량을 비교해 보면, 대형 모델이 강력한 성능을 갖기 위해서는 엄청난 에너지 소비가 전제되어야 함을 알 수 있습니다. 게다가 컴퓨팅 리소스와 연구를 대형 모델에 지나치게 집중시키면 다른 모델 연구를 위한 연구 공간이 부족해질 것입니다. 장기적으로는 컴퓨팅 자원이나 담론 권력을 독점하는 대기업만이 인공지능 연구 개발을 유지할 수 있게 되고, 대기업이 아닌 연구자들의 과학 연구 공간은 크게 제한될 것입니다.

두 번째 "E"는 인공지능의 급속한 발전으로 인해 수백 년간 축적된 자연과학 지식을 무시해서는 안 된다는 것입니다. 그래프 신경망은 학습된 특징 표현 외에도 인간의 사전 지식(귀납적 편향)을 우아하게 통합할 수도 있습니다. 또한 그래프 신경망은 다른 데이터 기반 모델과 비교했을 때 신호 처리, 사회적 역학 등 이론적으로 더 많은 뒷받침을 받고 있습니다.

세 번째 "X" 그래프 신경망은 딥 러닝 네트워크의 해석성을 높이는 데 도움이 됩니다. 인공지능이 발전하면서 사람들은 모델 결과의 중요성과 합리성에 점점 더 많은 관심을 기울이고 있습니다. 그래프 신경망의 해석 가능성에 대한 심층 연구를 통해 모델 결정의 논리와 근거를 더 잘 이해하고 모델의 신뢰성과 신뢰도를 향상시킬 수 있습니다.

넷째, "Y": 그래프 신경망은 아직 젊고 빠르게 발전하는 분야이기 때문에 해결되지 않은 문제와 과제가 많아 연구자들에게 탐구할 수 있는 넓은 공간을 제공합니다. 또한, 이미지 처리를 위한 합성곱 신경망이나 자연어 처리를 위한 자기 주의 메커니즘과 마찬가지로 그래프 신경망도 많은 생물학적 문제(특히 데이터가 부족하고 사전 지식이 중요한 문제)에 대한 좋은 해결책을 제공할 것입니다.

다음으로 그래프 신경망의 구체적인 응용 가치를 분자 데이터와 그래프 표현, 고전적 그래프 신경망 소개, 그래프 신경망과 더 많은 생물학적 문제라는 세 가지 측면에서 알려드리겠습니다.

분자 데이터와 그래프 표현: 생물학적 데이터 그래픽의 세 가지 요소

생물학적 데이터를 그래프로 표현하려면 먼저 다음 질문에 답해야 합니다. 그래프란 무엇이고, 그래프는 어떤 기본 요소로 구성되어 있을까요? 일반적으로 말해서,그래프는 노드, 에지(노드 사이의 연결 관계) 그래프(노드와 엣지로 구성된 완전한 개체).

생물학에서 연구대상을 정의하기 위해 이 세 가지 요소를 어떻게 사용할까요? 다음 그림은 4가지 사례를 보여줍니다.

작은 분자의 경우(그림) 각 원자는 노드로 정의할 수 있으며, 원자 간의 거리 관계나 화학 결합 관계는 모서리로 표현할 수 있습니다.

우리가 아미노산 수준에서 단백질을 살펴보면, 단백질 전체는 그래프로 볼 수 있으며, 각 아미노산은 그래프의 노드입니다. 서로 다른 아미노산이 공간적으로 가까운 경우, 아미노산 사이에 특정한 상관관계가 있다고 가정할 수 있으며, 이렇게 공간적으로 가까운 아미노산 노드는 모서리로 연결됩니다.

마찬가지로 우리가 단백질을 2차 구조에 따라 살펴보면, 그러면 각각의 2차 구조는 단백질 그래프의 노드로 볼 수 있고, 인접하거나 공간적으로 가까운 2차 구조는 모서리로 연결됩니다.

마지막으로 질병 지식 그래프의 경우, 다양한 질병, 유전자, 약물, 환자 및 기타 요소는 노드로 볼 수 있으며, 노드 간의 연결은 특정 약물이 특정 질병을 치료할 수 있다거나 특정 유전자가 특정 질병을 유발하는 것과 같이 이들 간의 복잡한 관계를 나타냅니다.

그래프를 정의한 후,다음 단계는 노드와 엣지의 특성 등 그래프의 정보를 어떻게 설명할 것인지 고려하는 것입니다.

아래 그림에서 보듯이, 4개의 노드 사이에는 특정한 관계가 있습니다. 이러한 관계를 정확하게 설명하기 위해 인접 행렬 A를 정의할 수 있습니다. 다양한 생물학적 데이터를 처리할 때 인접 행렬을 사용하여 원자 사이에 공유 결합이 있는지 여부를 특성화하거나 특정 아미노산의 k-차 이웃을 결정할 수 있습니다.

또한, 각 노드와 에지는 일련의 속성과 연관될 수 있습니다. 아미노산 노드를 예로 들면, 노드 속성에는 유형, 물리적, 화학적 특성과 같은 특성 정보가 포함될 수 있습니다. 에지는 노드를 연결하는 다리 역할을 하며 피처 정보를 전달할 수도 있습니다. 예를 들어, 각 모서리의 특징 벡터는 두 아미노산 사이의 거리(서열 거리와 공간 거리 포함)와 모서리를 설정하는 기준(공간 구조나 원자 화학 결합 등)을 포함합니다. 이러한 에지 특징은 노드 간의 관계를 이해하는 데 더욱 자세하고 심층적인 관점을 제공합니다.

요약하자면,모든 구조화된 개체(예: 단백질)는 그래프로 표현할 수 있습니다. 아래 그림과 같이 G는 그래프를 나타내는 데 사용할 수 있으며, v는 노드를 나타내고, ε는 에지를 나타내고, Xv는 노드의 특징을 나타내고, 인접 행렬 A는 노드 연결을 나타내고, Xe는 에지의 특징을 나타냅니다.

그래프의 세 가지 기본 요소(노드, 엣지, 그래프)를 기준으로 그래프의 벡터 표현 및 예측 작업은 다음과 같이 분류할 수 있습니다.

  • 노드 수준 예측. 예를 들어, 단백질 서열 설계를 할 때, 알려진 단백질 그래프가 주어졌을 때 그래프의 각 노드가 나타내는 아미노산 유형을 예측합니다.
  • 링크 예측. 그래프와 모든 노드가 주어졌을 때, 유전자 조절 네트워크, 약물 지식 그래프 및 기타 예측 작업과 같이 노드 간에 관계가 있는지 추론합니다.
  • 그래프 예측(그래프 수준 예측). 두 노드와 에지가 모두 결정되면 여러 그래프가 동시에 학습되고 분석되어 각 그래프의 레이블을 예측합니다.

그래프 신경망이란 무엇인가: GCN뿐만 아니라 GAT, GraphSAGE, EGNN 등

그래프 신경망은 주어진 노드 간의 연결 관계를 기반으로 각 노드의 은닉층 표현을 찾고, 각 노드에 대한 벡터 표현을 찾습니다. 다른 유형의 데이터와 비교했을 때 그래프의 가장 중요한 특징은 어떤 노드가 서로 직접적으로 관련되어 있는지, 그리고 서로 다른 노드 간의 관계가 얼마나 긴밀한지를 명확하게 나타낼 수 있다는 것입니다.따라서 그래프 신경망의 본질은 이러한 귀납적 편향을 이용하고 연결된 노드 간에 메시지를 전달하는 데 있습니다. 이웃 노드가 가까울수록 중앙 노드에 미치는 영향이 커집니다.

다음으로, 몇 가지 고전적인 그래프 합성 신경망을 소개해 드리겠습니다.

첫 번째는 그래프 합성 신경망 GCN입니다. 아래 그림에서 보듯이, GCN의 핵심은 각 계층이 중앙 노드에 대한 1차 이웃의 정보를 평균적으로 집계하고, 집계된 정보를 중앙 노드의 새로운 표현으로 사용한다는 것입니다.

표현식을 통해 GCN과 MLP의 차이점은 GCN이 인접 행렬을 추가하고 1차 이웃 정보를 사용하여 노드 표현을 업데이트한다는 것입니다. 또한, 정보를 집계할 때 자신의 정보를 강화하기 위해 셀프 루프를 추가하고, 각 이웃 노드의 이웃 개수에 따라 가중 평균화를 수행합니다.

  • 1차 이웃: 중앙 노드가 다른 노드에 직접 연결되어 있습니다. 즉, 한 모서리를 통해 도달할 수 있는 지점을 1차 이웃이라고 합니다.

두 번째는 그래프 어텐션 네트워크(GAT)입니다. GCN과 비교했을 때 GAT의 주요 변경 사항은 이웃 정보를 집계할 때 가중치를 계산하는 방식입니다. GCN은 인접 행렬을 기반으로 계산된 가중치를 사용하는 반면, GAT는 이웃 노드의 특성을 기반으로 학습 가능한 가중치를 계산합니다.

위의 두 가지 방법은 전도적 방법의 전형적인 대표입니다. 이러한 알고리즘은 완전한 그래프를 입력으로 요구하므로 계산 복잡도가 증가합니다.이와 관련하여 GraphSAGE는 귀납적 접근 방식을 제안합니다. 정보가 전송될 때마다 중앙 노드의 1차 이웃만 이해하면 되고, 이웃 정보의 일부만 무작위로 선택되어 집계됩니다.

위의 세 가지 방법은 2차원 위상 구조 그래프에서 노드의 표현을 업데이트하는 것이며, 이후의 메시지 전달 네트워크(MPNN)는 이러한 유형의 정보 집계 방법을 프레임워크로 통합합니다. 그러나 많은 생물학적 데이터(예: 분자)도 3차원 구조를 고려해야 합니다.공간 정보를 통합하기 위해 등가 그래프 신경망(EGNN)을 사용할 수 있습니다. 아래 그림에서 보듯이, 이 방법의 핵심은 노드 자체의 특징 정보 외에 노드 간의 상대적 위치 관계도 도입하여 학습된 표현의 회전 등가성과 이동 불변성을 보장한다는 것입니다.

이 외에도 다양한 고급 그래프 신경망 설계가 있습니다. 일부 설계는 모델의 예측 성능을 개선할 뿐만 아니라 효율성 개선, 과도한 평활화 감소, 다중 스케일 표현 추가 등의 요구 사항에 초점을 맞춥니다. 연속 메시지 전달, 스펙트럼 그래프 합성곱 방법 등을 도입함으로써 특정 문제에 대해 더욱 표현력이 풍부한 그래프 신경망을 제공할 수도 있습니다.

그래프 신경망의 중요한 응용 분야: 단백질 속성 예측 및 시퀀스 생성을 예로 들어 보겠습니다.

다음으로, 단백질 표현 학습에서 그래프 신경망의 응용에 대해 알려드리겠습니다.여기서는 예측 모델과 생성 모델이라는 두 가지 범주로 나누겠습니다.

단백질 특징 인코딩 및 속성 예측

예측 작업 측면에서 우리는 돌연변이 속성 예측, 용해도 예측, 하위 그래프 매칭이라는 네 가지 특정 작업의 세 가지 유형을 고려합니다.

첫 번째 연구는 돌연변이 작업 예측에 관한 것입니다. 아래 그림에서 보듯이, 우리는 단백질 아미노산의 내부 공간 관계를 특성화하기 위해 등가 그래프 신경망을 사용했습니다. 여기서 각 노드는 아미노산을 나타내며, 이는 해당 지점에서 아미노산의 유형, 물리적 및 화학적 특성, 기타 특성을 나타냅니다. 그래프의 모서리 연결은 아미노산 간의 관계, 예를 들어 공통 진화의 가능성과 상호 힘의 영향 등을 반영합니다.

그런 다음 예측 모델을 사용하여 다양한 돌연변이에 점수를 매기고 단백질 특성을 최적화할 가능성이 가장 높은 높은 점수의 돌연변이 조합을 식별했습니다. 이 가벼운 그래프 신경망은 아미노산과 아미노산 간의 관계를 통합하여 학습 및 데이터 비용을 크게 줄일 수 있으며, 높은 성능을 유지하면서도 모델을 작고 아름답게 만들 수 있습니다. 또한, 다양한 단백질 특성에 대한 습식 실험 검증을 통해 이 모델이 지향성 진화의 효과와 성공률을 크게 향상시킬 수 있음이 입증되었습니다. 이 연구의 제목은 "경량 그래프 잡음 제거 신경망을 이용한 단백질 공학"이며 ACS JCIM에 게재되었습니다.

서류 주소:

https://pubs.acs.org/doi/10.1021/acs.jcim.4c00036

두 번째 과제는 구조적 코딩에 기반하여 단백질 서열 코딩을 추가로 추가하는 것입니다. 이는 구조적 정보에서 인접한 아미노산 간의 상호작용은 더 강하고, 먼 거리의 상호작용은 매우 약하다고 가정하기 때문입니다. 이러한 가정은 실제 상황에 완전히 맞지 않으므로 장거리 상호작용을 고려하기 위해서는 시퀀스 정보가 필요합니다. 또한, 다양한 생물학적 특성에 대한 정보는 각기 다른 강조점을 갖습니다. 결합 에너지와 열 안정성의 경우 구조 정보가 중요한 역할을 하지만, 촉매 활성과 같은 특성의 경우 아미노산 유형에 대한 정보가 더 중요합니다.

아래 그림에서 볼 수 있듯이, 우리는 ProteinGym에서 200개 이상의 분석에 대한 실험적 테스트를 수행하였고, 비 MSA 방법 중 가장 좋은 성능을 얻었습니다. 해당 연구는 "생체 활성과 열 안정성 향상을 위한 의미론적, 기하학적 단백질 인코딩"이라는 제목으로 eLife에 게재되었습니다.

서류 주소:

https://elifesciences.org/reviewed-preprints/98033

세 번째 연구의 아미노산 수준 코딩 모듈은 두 번째 연구의 모듈과 일치합니다. 정보 통합은 단백질 서열과 구조에 기초합니다. 차이점은 단백질 길이, 20개 아미노산의 비례 분포 등 기존 지식을 바탕으로 다양한 단백질 수준의 정보도 통합한다는 점입니다.

아래 그림에서 볼 수 있듯이, 우리는 단백질 용해도에 대한 모델의 예측 효과를 테스트하였고, 계산과 실험을 기반으로 수천 개의 테스트 데이터에 대한 SOTA 결과를 얻었습니다. "ProtSolM: 다중 모드 특성을 이용한 단백질 용해도 예측"이라는 제목의 연구가 IEEE BIBM2024(CCF 카테고리 B 컨퍼런스)에 승인되었습니다.

사전 인쇄본 주소:

https://www.arxiv.org/abs/2406.19744

네 번째 과제는 단백질 구조의 국부적 유사성을 탐구하는 것입니다. 아래 그림에서 보듯이, 단백질은 전체적으로 크지만 그 핵심은 특정한 국소적 구조적 특징에 있을 수 있습니다. 또한 거시적인 관점에서 보면 두 단백질은 서열과 구조가 완전히 다를 수 있지만, 유사하거나 심지어 동일한 핵심 기능 모듈을 가질 수도 있습니다.

따라서 우리는 각 단백질의 국소적 구조에 대한 암묵적 표현을 찾고 이러한 벡터 간의 유사성을 계산합니다. 구조 간의 일대일 유사성을 비교하는 것 외에도, 2개의 완전한 단백질 사이에 정렬 가능한 국소 구조 조각이 있는지도 평가합니다. "시퀀스 정보 임베딩을 통한 단백질 표현 학습: 항상 더 나은 성능으로 이어질까?"라는 제목의 연구가 IEEE BIBM2024에 수락되었습니다.

사전 인쇄본 주소:

https://arxiv.org/abs/2406.19755

시퀀스 생성

다음으로, 단백질 구조에 적합한 아미노산 서열을 설계하는 작업 두 가지를 공유해드리겠습니다. 이 두 연구의 핵심 모델은 확산 확률 모델(Diffusion)입니다.

첫 번째 과제는 단백질 성능을 개선하기 위해 알려진 아미노산 골격을 기반으로 완전한 단백질 서열을 설계하는 것입니다. 모델 프레임워크는 아래 그림과 같습니다. 지시된 진화와는 달리, 우리는 한 번에 수백 개의 아미노산을 변형하여 더 높은 다양성을 지닌 단백질 서열을 얻었습니다. 한편, 이 방법은 진화를 위한 완전히 새로운 출발점을 찾을 수 있고 지향성 진화에서 흔히 나타나는 국소 최적성 및 부정적인 상향 효과와 같은 문제를 피할 수 있습니다. 반면, 더 많은 아미노산을 변형하여 서열 유사성은 낮지만 기능은 동일한 단백질을 얻음으로써 특허 봉쇄를 깨는 것이 가능해진다.

우리는 두 가지 Argonaute 단백질(각각 중간 및 초고온에서 작동)을 설계 템플릿으로 사용했으며, 생성된 40개 이상의 단백질 중 대부분은 실온에서 DNA 절단을 수행할 수 있습니다. 가장 우수한 설계는 야생형보다 절단 활성이 10배 이상 높고, 열 안정성도 크게 향상되었습니다. "조건부 단백질 잡음 제거 확산은 프로그래밍 가능한 엔도뉴클레아제를 생성한다"라는 제목의 이 연구는 Cell Discovery에 게재되었습니다.

사전 인쇄본 주소:

https://www.biorxiv.org/content/10.1101/2023.08.10.552783v1

두 번째 과제는 아래 그림에서 보듯이 아미노산의 골격 구조를 엄격하게 제한하지 않고 2차 구조에 기반하여 채워야 할 아미노산의 개수와 위치를 독립적으로 결정하는 것입니다. 골격 기반 생성 방법과 비교했을 때, 이러한 보다 거친 생성 조건은 생성된 시퀀스에 시퀀스 다양성을 도입할 수 있으며, 단백질 변형 및 새로운 설계의 특정 요구 사항도 충족할 수 있습니다(예를 들어, 막 단백질의 경우 막 부분만 나선 구조로 제한되고, 이 부분의 길이와 특정 골격은 엄격하게 제한되지 않음). "잠재 그래프 확산을 통한 2차 구조 기반 신규 단백질 서열 생성"이라는 제목의 이 연구는 ICML AI4Science에서 수락되었으며, 전체 텍스트는 현재 심사 중입니다.

사전 인쇄본 주소:

https://arxiv.org/html/2407.07443v1

위의 두 가지 단백질 서열 설계 작업은 확산을 기반으로 하며, 단백질 골격에 따라 전체 서열을 생성하거나, 핵심 아미노산과 골격 구조를 고정하여 생성 조건으로 고정되지 않은 부분의 아미노산 서열을 채울 수 있습니다.

더 많은 생물학적 문제에 대한 그래프 신경망의 적용

기존의 분자 그래프 모델링 외에도 그래프 신경망은 다른 유형의 데이터와 문제에도 적용되어 더욱 생물학적인 문제에 대한 연구를 촉진할 수 있습니다. 다음으로 두 가지 예를 들어보겠습니다.

첫 번째 예는 생물학적 사회 네트워크 분석 및 단순화입니다. 인간의 사회적 네트워크에서의 복잡한 관계와 마찬가지로, 생물학적 사회적 네트워크(미생물 네트워크, 유전자 네트워크 등)에도 다양한 수준에서 탐구할 만한 가치가 있는 내용이 많이 있습니다.

우리는 이전에 유전자 동시 발생 네트워크를 사용하여 사회적 네트워크 단순화 연구를 수행했습니다. 아래 그림에서 보듯이, 그림 a와 b는 심해와 높은 산에서 발견된 동일한 유전자의 서로 다른 네트워크입니다. 원래 형태는 복잡하고 무질서합니다. 인간의 사회적 네트워크와 유사한 그래프 신경망을 구축함으로써 두 네트워크를 단순화하고, 절대적인 지배적 위치를 차지하는 유전자를 식별하고, 어떤 유전자가 더 가까운 연결을 가지고 있고 어떤 유전자가 상대적으로 약한 연결을 가지고 있는지 구별합니다. 단순화된 네트워크는 생물학자들이 전문지식을 활용하여 네트워크와 생물학적 공동체를 분석하는 데 도움이 될 수 있습니다. 이 연구의 예비 버전은 "소셜 네트워크의 의견 역학을 통한 신경 메시지 전달에 대한 통합적 견해"라는 제목을 가지고 있습니다.

사전 인쇄본 주소:

https://arxiv.org/abs/2310.01272

두 번째 예는 그래프 신경망을 기반으로 한 해석 가능성 연구입니다. 직관적인 예로, 그래프 신경망은 분자 내의 주요 국소 구조를 식별하는 데 도움이 될 수 있습니다. 한편, 이 결과는 모델의 합리성을 테스트하는 데 사용될 수 있습니다. 예를 들어, 단백질 기능을 예측할 때, 모델이 어느 정도까지 활성 중심 근처에 주요 원자나 아미노산을 위치시킬 수 있다면, 그 모델이 어느 정도 합리성을 가지고 있다는 것을 의미합니다. 반대로, 모델의 주의가 단백질 표면의 여러 아미노산에 무작위적이고 개별적으로 분포되어 있다면 모델에 문제가 있을 수 있습니다. 반면, 이상적으로는 각 노드의 기능적 예측에서의 역할을 분석함으로써 합리적이고 강력한 설명 모델이 있다면, 앞으로 완전히 새로운 단백질의 포켓 영역을 식별하는 데도 도움이 될 수 있습니다.

대규모 모델은 다양한 응용 시나리오에서 풍부한 성공 경험을 제공했지만, 모든 문제를 해결하는 유일한 솔루션은 아닙니다. 다양한 구조화된 데이터가 자연스럽게 존재하는 분야로서, 그래프 신경망은 생물학의 많은 문제에 대한 가능한 해결책을 제공할 수 있습니다. 분자, 복합체, 유전자, 미생물 네트워크 또는 더 크고 복잡한 시스템이든, 그래프 신경망은 귀납적 편향을 심어주고 소량의 데이터일지라도 인간의 사전 지식을 극대화함으로써 간단한 솔루션을 제공할 수 있습니다.

주빙신 소개

저우빙신

저우빙신은 현재 상하이 교통대학교 국가 응용수학센터의 연구원 보조로 재직 중이다. 그녀는 2022년 호주 시드니 대학교에서 박사학위를 받았고, 영국 케임브리지 대학교에서 방문 학자로 재직했습니다. 그의 연구는 효소 공학, 대사 유전자 네트워크, 단백질 구조 그룹 진화 분석과 같은 생물학의 과제를 해결하기 위해 딥 러닝(특히 기하학적 딥 러닝)을 사용하는 데 중점을 두고 있습니다. 개발된 딥러닝 알고리즘은 정적, 동적, 이기종 및 노이즈 그래프를 처리하는 데 사용되며, 이 중 일부는 IEEE TPAMI, JMLR, ICML, NeurIPS와 같은 최고 국제 저널과 컨퍼런스에 게재되었습니다. 단백질 공학 및 서열 설계를 위한 일반적인 딥러닝 프레임워크는 복잡한 단백질의 활성을 효과적으로 설계하고 크게 향상시킬 수 있으며, 그 결과 중 일부는 eLife, Chem.과 같은 저널에 게재되었습니다. 과학, 그리고 ACS JCIM.

개인 홈페이지:
https://ins.sjtu.edu.cn/peoples/ZhouBingxin

구글 학술 검색:

https://scholar.google.com/cita