HyperAI초신경

Nature 저널에 게재되었습니다! 중국 중부사범대학은 AI를 사용하여 분자 조각을 정확하게 분할하고 44개의 약물/살충제 분자를 생성하는 DigFrag를 제안했습니다.

特色图像

지난 수십 년 동안 단편 기반 약물 발견(FBDD)은 표적 단백질과 약한 상호작용을 하는 소분자 단편을 식별하고 이러한 단편의 구조 정보를 최적화하여 더욱 활성적인 선도 화합물을 개발함으로써 새로운 약물 연구 및 개발에 중요한 역할을 해왔습니다.

FBDD가 약물 발견 및 개발에 핵심적인 역할을 하지만, 효과적인 분자 단편 라이브러리를 구축하고 스크리닝하는 것은 이 분야에서 항상 큰 과제였습니다. 기존의 FBDD 방법은 경험적 직관에 의존하기 때문에 다양한 구조를 개발하는 능력이 제한됩니다. 다행히도 AI의 등장으로 이러한 과제에 대한 혁신적인 해결책이 제공되었습니다.

최근, 중부사범대학의 양광푸 교수와 왕판 부교수 팀은 DigFrag라는 디지털 세분화 방법을 개발했습니다.이 방법은 분자 그래프에 국부적으로 초점을 맞추고, 주요 하위 구조를 강조하고, 이러한 하위 구조를 조각으로 나눕니다. 실험 결과에 따르면 DigFrag를 통해 분할된 조각은 더 높은 구조적 다양성을 보였으며, 이러한 조각을 기반으로 생성된 화합물은 예상했던 화학적 특성과 더 일치했습니다. 이는 AI 방법을 사용하여 생성된 데이터가 AI 모델의 훈련 및 적용에 더 적합할 수 있음을 시사합니다.

"인공지능 기반 약물 설계에 사용되는 디지털 단편화 방법인 DigFrag"라는 제목의 연구는 국제 학술지인 Nature Communications Chemistry에 게재되었습니다.

연구 하이라이트:

* 연구에 따르면 DigFrag 기반 조각을 AI 모델과 결합하면 원하는 속성을 가진 분자를 효과적으로 생성할 수 있다는 사실이 밝혀졌습니다.

* 정밀한 스크리닝을 통해 최종적으로 24개의 약물 분자와 20개의 살충제 분자를 확인했습니다.

* 팀은 다양한 분자 분석 및 설계 작업을 지원하기 위해 여러 분할 기술을 통합하는 사용자 친화적 플랫폼인 MolFrag를 개발했습니다.


서류 주소:
https://doi.org/10.1038/s42004-024-01346-5

오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.

https://github.com/hyperai/awesome-ai4s

데이터 세트: 자체 구축 데이터베이스 PADFrag, 약 3,000여종의 약물 데이터 포함

이 연구에서 사용된 모델링 데이터 세트는 주로 자체 구축된 데이터베이스 PADFrag에서 가져왔습니다. 구체적으로 PADFrag 데이터베이스에는 주로 DrugBank 데이터베이스의 FDA 승인 약물 카탈로그가 포함되어 있으며, 여기에는 1,652개의 약물이 포함되어 있고, Alan Wood가 나열한 상업용 살충제는 총 1,259개입니다.

*PADFrag는 약물 발견을 위한 생물학적 활성 단편의 공간을 탐색하기 위해 구축된 데이터베이스입니다.
https://pubs.acs.org/doi/10.1021/acs.jcim.8b00285

연구팀은 데이터의 일관성과 신뢰성을 보장하기 위해 비표준 구조를 가진 화합물을 제외했습니다. 이후, 전체 데이터 세트를 8:1:1의 비율로 훈련 세트, 검증 세트, 테스트 세트로 나누어 모델의 훈련, 평가, 테스트를 용이하게 했습니다.

DigFrag: 구조적 다양성이 더 큰 조각을 얻기 위한 3단계 워크플로

DigFrag는 그래프 주의 메커니즘을 사용하여 약물/살충제 조각을 식별하고 세분화하는 혁신적인 디지털 세분화 방법입니다. 이 기술의 핵심 장점은 인간의 전문 지식에만 의존하는 것이 아니라 기계 지능의 관점에서 구조적 다양성이 더 높은 조각을 얻을 수 있다는 것입니다.

또한, 이 연구에서는 BRICS, RECAP, MacFrag, DigFrag의 4가지 방법으로 세분화된 단편을 통합하고 이를 DeepFMPO 모델 프레임워크에 통합하여 약물 분자를 생성하고 다양한 지표에 대한 성능을 평가했습니다.

마지막으로, 연구진은 다양한 분자 분할 기술을 기반으로 분자 분할 작업을 지원하는 사용자 친화적인 플랫폼 MolFrag를 개발했습니다.

구체적으로 이 연구의 워크플로는 세 부분으로 나뉩니다.

첫째, AI 기반 분할 접근 방식입니다.본 연구는 그래프 신경망(GNN) 아키텍처를 기반으로 하며 DigFrag 방법을 사용하여 분자를 분할합니다.

AI 기반 단편화 접근 방식

위의 그림 A에 표시된 것처럼 연구자들은 분자 그래프를 G=(V, E)로 정의했습니다. 여기서 V는 노드를 나타내며 분자의 원자에 해당하고 E는 연결 에지를 나타내며 원자 사이의 화학 결합에 해당합니다. 이 과정에서는 그래프 어텐션 메커니즘의 특징 추출 네트워크(특징 행렬)를 기반으로 원래 분자 그래프를 먼저 일련의 어텐션 계층에 입력하여 각 원자에 대한 별도의 임베딩 표현을 얻습니다. 이러한 원자적 임베딩은 통합된 벡터를 형성하기 위해 집계되는데, 이를 슈퍼 노드라고도 합니다. 마지막으로, 추가적인 주의 계층 처리를 통해 전체 조각의 내장된 표현이 얻어집니다.

둘째, Actor-Critic 모델 프레임워크아래 그림 B에서 보듯이, 디지털 분할이 프래그먼트 기반 딥 생성 모델에 미치는 영향을 더욱 명확히 하기 위해 연구진은 BRICS, RECAP, MacFrag, DigFrag의 네 가지 방법으로 분할된 프래그먼트를 통합하고, 오픈 소스 프래그먼트 기반 강화 학습 2차원 분자 생성 도구인 DeepFMPO 아키텍처를 연구에 사용했습니다.

*DeepFMPO는 화합물의 조각을 대체하여 원하는 화합물을 얻는 Actor-Critic 강화 학습 모델입니다.

배우-비평가 모델 프레임워크

셋째, 온라인 플랫폼을 구축하세요.다양한 분자 단편화 방법이 개발되었지만, 사용하기 쉬운 온라인 서버가 부족합니다. 따라서 본 연구에서는 위의 그림 C와 같이 다양한 분할 기술을 기반으로 사용자 친화적인 플랫폼인 MolFrag를 개발했습니다. 이 플랫폼은 BRICS, RECAP, MacFrag, DigFrag의 4가지 분자 단편화 방법을 완벽하게 결합하여 다양한 수준의 전문성을 갖춘 연구자가 사용할 수 있도록 보장합니다.

MolFrag 플랫폼 주소:

https://dpai.ccnu.edu.cn/MolFrag

온라인 플랫폼

연구 결과: DigFrag 분할 분자 조각은 더 높은 다양성을 갖습니다.

DigFrag 조각에는 많은 수의 회전 가능한 결합이 있습니다.

이 연구에서는 먼저 약물과 살충제 조각을 정확하게 분할하도록 모델을 훈련시켰습니다. 그런 다음 연구진은 DigFrag의 세 가지 핵심 성과 지표인 모델 정확도, 곡선 아래 면적(AUC), 매튜스 상관 계수(MCC)를 전통적인 방법(RECAP, BRICS)과 최신 방법(MacFrag)으로 얻은 조각의 5중 교차 검증을 통해 심층적으로 비교했습니다. 아래 표에서 볼 수 있듯이, DigFrag로 분할한 조각과 BRICS로 분할한 조각 사이의 약물 조각 속성 분포는 더 유사합니다.

BRICS, RECAP, MacFrag 및 DigFrag 방법으로 분할된 약물 조각의 속성

아래 표에서 볼 수 있듯이 DigFrag로 분할된 약물 단편의 분자량과 H-결합 수용체의 수는 BRICS로 분할된 것과 비슷하지만 회전 가능한 결합의 수가 더 많습니다. 이는 고유한 고리 구조 파손 모드와 관련이 있을 수 있습니다. 살충제 조각의 경우, DigFrag로 분할한 조각의 평균 분자량은 더 낮습니다.

BRICS, RECAP, MacFrag 및 DigFrag 방법으로 분할된 살충제 조각의 특성

DigFrag 분할된 조각은 더 높은 구조적 다양성을 갖습니다.

이 연구는 DigFrag 방법을 기존 방법(RECAP 및 BRICS)과 최신 방법(MacFrag)과 비교하면서 분할된 조각의 구조적 다양성을 평가하는 데 중점을 두었습니다. 실험 결과, DigFrag를 이용하여 약물과 살충제에서 분할한 단편은 다른 세 가지 방법보다 반복률이 낮은 것으로 나타났는데, 반복률은 각각 9.97%-21.37%와 8.94%-15.20%였습니다. 이는 DigFrag가 고유한 단편을 생성할 수 있음을 나타냅니다. MacFrag는 BRICS와 RECAP의 대부분 부분을 다루면서, 그것이 완전히 혁신적인 것은 아니며 기존 접근 방식의 확장이라고 제안합니다.

다양한 방법으로 얻은 약물/살충제 단편 간의 중복 수

연구진은 또한 t-SNE 알고리즘을 사용하여 화학 공간 분포를 시각화했습니다. 아래 그림에서 볼 수 있듯이 DigFrag는 조각 클러스터링 비율 측면에서 좋은 성능을 보이며, 특히 유사도 임계값이 0.4와 0.6일 때 더 높은 구조적 다양성을 보여줍니다.

다양한 유사도 임계값에서 약물 조각과 살충제 조각의 클러스터링 비율 참고: 클러스터링 비율은 조각 세트의 전반적인 구조적 다양성을 직관적으로 반영할 수 있습니다.

DigFrag 기반 모델은 더 높은 품질의 분자를 생성합니다.

이 연구에서는 MOSES 벤치마크 플랫폼에서 다양한 생성 모델의 성능을 비교했습니다. 아래 두 표에서 볼 수 있듯이 DigFrag 기반 모델은 0.828의 필터 점수를 달성하여 더 높은 안전성을 나타냈습니다. 이는 딥러닝의 단편화 과정에서 독성과 안정성을 종합적으로 고려했기 때문일 수 있습니다.

약물 및 살충제 분자에 대한 4가지 심층 생성 모델의 성능 평가

아래 그림에서 볼 수 있듯이, 살충제 분자의 경우 DigFrag 기반 모델에서 생성된 분자 조각은 SMILES 타당성, 신규성, 골격 다양성, 구조 경고 측면에서 좋은 성과를 보였습니다. 또한, DigFrag 모델이 생성한 약물 및 살충제 분자 조각은 양적 추정의 평균값 분석(QED)과 합성 접근성(SA)에서 다른 모델보다 우수한 성능을 보였습니다.

4개의 심층 생성 모델로 분할된 대표 분자 조각의 품질

또한, DigFrag로 분할된 분자 조각은 분자량, QED 및 SA 속성 분포 측면에서 MOSES 데이터 세트와 가장 높은 유사성을 보입니다. 이러한 결과는 DigFrag 모델이 더 높은 품질의 분자를 생산할 수 있음을 나타내며, 분자 설계에서 AI 모델이 AI에서 파생된 데이터를 선호한다는 점을 강조하여 이 분야에서 AI 기술의 적용 이점을 강조합니다.

고효율 저에너지 약물 및 살충제 분자 44개 선정

마지막으로, 정밀한 스크리닝을 거쳐, 이 연구에서는 24개의 약물 분자와 20개의 살충제 분자를 확인했으며, 이들은 모두 QED 값이 0.75 이상, SA 값이 3 미만, 결합 자유 에너지가 돔페리돈(-10.7 Kcal/mol) 및 메토트리아진(-8.4 Kcal/mol)보다 낮은 기준을 충족했습니다.

이 연구에서는 이들 분자와 표적 간의 상호작용을 추가로 분석했습니다. 아래 그림에서 볼 수 있듯이, 이 연구에서는 약물 분자가 DRD2 활성 포켓에 효과적으로 결합하여 주요 아미노산 잔류물과 수소 결합을 형성할 수 있다는 것을 발견했습니다.

AutoDock 분석을 통해 생성된 DRD2에 대한 약물 분자의 결합 모드

게다가 아래 그림에서 보듯이 살충제 분자는 수소 결합을 형성함으로써 HPPD의 아미노산 잔기와 안정적으로 결합됩니다. 양성 약물과 비교했을 때, 생성된 화합물은 다른 결합 모드를 보였으며, 이는 다양한 약리학적 메커니즘의 가능성을 시사하며, 이는 미래 연구에 새로운 방향을 제시합니다.

AutoDock을 사용하여 살충제 분자의 HPPD 결합 모드 분석

약물 연구에 AI를 적용하면 게임의 규칙이 바뀌게 됩니다.

이 단계에서는 약물 연구에 AI를 적용하는 것이 점점 더 심층적으로 진행되고 있습니다. AI 모델은 딥 러닝 네트워크를 통해 복잡한 생물학적 데이터와 화학 구조를 분석하여 약물 분자의 활동성과 선택성을 예측할 수 있습니다.

이 연구에서 언급된 양광푸 교수와 왕판 부교수 팀은 올해 초 살충제와 유사한 특성을 예측하기 위한 다중 모드 딥 러닝 아키텍처 모델인 Pesti-DGI-Net을 공동으로 개발했습니다. 분자 설명자, 분자 이미지, 분자 그래프의 세 가지 분자 표현 형태를 통합하여 화합물의 살충제와 유사한 특성을 예측할 수 있습니다. 결과는 Pesti-DGI-Net이 여러 지표에서 뛰어난 성과를 보인다는 것을 보여줍니다.
논문 링크:

https://doi.org/10.1016/j.compag.2024.108660

또한 AI는 최근 약물 연구 분야에서도 성과 있는 성과를 거두었습니다. 얼마 전, 중국과학원 상하이 영양건강연구소는 약물 조합의 상승효과를 예측하기 위해 듀얼 뷰 딥러닝 모델인 JointSyn을 구축했습니다. 결과에 따르면 JointSyn은 다양한 벤치마크에서 예측 정확도와 견고성 측면에서 기존의 최첨단 방법보다 성능이 뛰어납니다.
논문 링크:

https://doi.org/10.1093/bioinformatics/btae604

AI 기술은 약물 특성 예측에 응용될 뿐만 아니라, 약물 설계 최적화, 독성학 및 안전성 평가, 임상 시험 설계, 환자 선정 등 여러 분야에서도 주목할 만한 연구 성과를 달성했습니다. AI를 약물 연구에 적용하면 약물 개발의 규칙이 바뀔 것으로 예상됩니다. 기술의 지속적인 발전으로 예측 정확도가 향상되고, 약물 설계가 최적화되고, 개발 비용과 시간이 단축되어 환자에게 더 안전하고 효과적인 치료 옵션이 제공될 수 있습니다.