동중국과학기술대학 이홍린 연구팀, 거대고리약물 발견 가속화 위해 맥포머 개발

거대고리 화합물은 12개 이상의 원자로 구성된 작은 분자 또는 펩타이드입니다. 다른 소분자 화합물과 비교했을 때 거대고리 화합물은 구조와 성능 면에서 많은 장점을 가지고 있어 다양한 표적에 대한 잠재적인 치료제로 여겨진다.
의약화학 합성을 기반으로 한 거대고리 유사체는 거대고리 약물의 주요 공급원입니다. 그러나 합성 방법의 부족, 합성의 높은 난이도, 참고 물질의 부족으로 인해 거대고리 약물의 개발은 별로 주목받지 못했습니다.
이러한 목적을 위해, 동중국과학기술대학의 리홍린 연구진은 Transformer를 기반으로 Macformer를 개발했습니다. 맥포머는 비고리형 약물인 페이조티닙을 성공적으로 거대고리화하여 효능이 더 강한 새로운 화합물을 얻었으며, 약물 개발에 대한 새로운 접근 방식을 제공했습니다.
저자 | 쉐차이
편집자 | 산양
거대고리약의 역사
거대고리는 12개 이상의 원자로 구성된 작은 분자 또는 펩타이드입니다.. 이 유형의 화합물은 분자량이 높고 수소 결합 공여체의 수가 많으며, 친화력, 선택성 및 약리학적 특성이 더 강합니다.거대고리 약물은 다양한 표적에 대한 잠재적인 치료제로 간주되어 왔습니다.예를 들어, 키나제, 프로테아제, G-단백질 결합 수용체 등이 있습니다.

천연 거대고리 약물 외에도 약제학적 화학 합성을 기반으로 한 유사체도 거대고리 약물의 주요 공급원입니다.알려진 비고리형 약물을 거대고리화함으로써, 새로운 거대고리형 약물을 직접적이고 효과적으로 얻을 수 있습니다., 원하는 약리학적 특성을 달성합니다. 하지만,합성방법의 부족과 합성의 높은 난이도로 인해거대고리 약물은 여전히 약물 설계에 있어서 별로 주목을 받지 못하고 있다.
현재 선형 분자의 거대고리화는 주로 경험적 추론에 의존합니다.. 게다가 문헌에 최종 합성 결과가 제시되어 있더라도, 약물의 합성 및 추론 과정은 항상 모호합니다. 불투명하고 비표준적인 합성 과정은 산업의 한계를 높이고 거대고리 약물의 개발을 방해했습니다.
딥러닝은 약물 개발의 다양한 단계에서 큰 잠재력을 보여주었지만,하지만 신경망을 훈련하려면 많은 데이터가 필요합니다.. 임상적으로 승인된 거대고리 약물이 90개 미만인 점을 고려하면, 딥러닝 알고리즘을 사용하여 약물의 거대고리화에 대한 연구는 없습니다.
이를 위해,동중국과학기술대학의 Li Honglin 연구 그룹은 변압기를 기반으로 Macformer를 개발했습니다.선형 분자의 거대고리화를 달성합니다. 그들은 서로 다른 단순화된 분자 선형 입력 사양(SMILES)을 사용하여 동일한 화합물을 표현함으로써 데이터를 확장했습니다.
이후, 미국 식품의약국(FDA)의 승인을 받은 JAK2 억제제인 페드라티닙을 예로 들어, 맥포머를 사용하여 거대고리화시켜 새로운 거대고리 화합물을 얻었습니다.이 화합물은 더 나은 선택성과 약동학적 특성을 가지고 있으므로 필요한 복용량은 푸조티닙보다 낮습니다.. 이 결과는 "Nature Communication"에 게재되었습니다.

신문을 받으세요:https://www.nature.com/articles/s41467-023-40219-8
공식 계정을 팔로우하고 "macrocyclic drugs"에 답글을 달면 전체 논문 PDF를 받을 수 있습니다.
실험 절차
데이터세트:ChEMBL 데이터 세트의 데이터 증강
먼저, 연구진은 ChEMBL 데이터베이스에서 생물학적으로 활성한 거대고리 화합물 18,357개를 수집하여 스크리닝했습니다. 그런 다음 거대고리 화합물의 두 화학 결합을 가로지르고, 연결기를 분리하여 해당 비고리 화합물을 찾습니다.마지막으로, 이 연구를 위한 데이터 세트로 총 237,728쌍의 거대고리-비고리 화합물이 얻어졌습니다..

각 화합물에는 특정한 SMILES 표현이 있습니다. 그러나 최근 연구에 따르면화학적으로는 동일하지만 구문적으로는 다른 무작위 SMILES 표현식 세트를 사용한 모델 학습이를 통해 딥 러닝 모델의 성능을 크게 향상시킬 수 있습니다. 연구진은 2배, 5배, 10배로 확장한 데이터를 원래 데이터와 비교하였고, 모든 데이터는 50,000단계 이후 좋은 수렴성을 보였습니다.

모델 아키텍처:변압기 인코딩 및 디코딩
Macformer는 Transformer 아키텍처를 기반으로 합니다.. 입력 및 대상 화합물의 SMILES 시퀀스는 훈련 가능한 행렬에 내장되고 사인 및 코사인 함수를 사용하여 위치적으로 인코딩됩니다.
입력 화합물의 임베딩 행렬은 인코더에 입력되어 인코딩 프로세스를 초기화하기 위한 잠재 표현을 생성합니다. 각 인코더 계층은 멀티헤드 어텐션 계층과 위치 피드포워드 네트워크로 구성됩니다.
Macformer의 궁극적인 목표는 교차 엔트로피 손실 함수를 통해 예측된 시퀀스와 해당 대상 시퀀스 간의 격차를 최소화하고 예측된 거대고리 화합물을 출력하는 것입니다..

비교 연구:ChEMBL 데이터 세트
연구자들은 Macformer를 딥러닝이 아닌 모델인 MacLS와 비교했습니다. 비고리형 화합물을 입력하면 둘 다 거대고리형 유사체를 출력할 수 있습니다. 그러므로,거대고리의 화학적 타당성, 신규성 및 고유성은 모델 성능의 평가 기준으로 사용됩니다..
원래 데이터 세트와 비교했을 때, 데이터 세트를 2배로 확장하자 모델의 전반적인 성능이 향상되었습니다. 특히 회복률(96.09% 대 54.85%), 효과성(80.34% 대 66.74%), 커넥터의 참신성(58.91% 대 40.56%) 측면에서 향상되었습니다. 그러나 데이터 세트를 더 확장해도 모델 성능은 더 이상 향상되지 않았습니다.

MacLS_self는 비순환 SMILES를 사용하여 새로운 형태를 생성하는 반면, MacLS_extra는 표적 거대고리의 저에너지 3D 구조에서 형태를 추출합니다.
MacLS_self의 효과는 단지 17.05%인 반면, MacLS_extra 화합물의 참신성과 독특성은 Macformer를 능가합니다. 그러나 MacLS는 훈련 세트에서만 연결을 검색할 수 있으므로 연결의 참신성은 0입니다. 게다가 MacLS에 의한 거대고리 화합물의 회수율도 5%보다 매우 낮습니다.
비교 연구:아연 데이터 세트
또한, 두 모델은 외부 데이터 세트 ZINC에서 비교됩니다. 5배 확장된 데이터 세트로 학습된 Macformer 모델은 80% 이상의 회복률, 84% 이상의 효과성, 99% 이상의 참신성을 보였습니다.위의 결과는 Macformer가 데이터 확장 후 우수한 일반화 능력을 가지고 있음을 보여줍니다.

MacLS는 Macformer의 학습 능력이 없으므로, 다양한 데이터 세트에 대한 결과는 기본적으로 비슷합니다.
화학 물질 분배:Macformer는 입력과 더 유사합니다
링커의 참신성과는 관계없이 Macformer와 MacLS는 모두 새로운 거대고리를 생성할 수 있는 능력을 가지고 있습니다. 따라서 연구진은 두 가지 물질이 생성한 화합물의 분포를 화학 공간에서 비교했습니다.
먼저, 타니모토 계수를 사용하여 화합물 간의 유사성을 비교했습니다. 비고리형 화합물과 거대고리형 화합물 사이의 구조적 유사성으로 인해, 모델에 의해 생성된 대부분의 화합물의 타니모토 계수는 0.7 이상입니다. 그러나 Macformer로 생성된 화합물은 원래 화합물과 구조적으로 유사성이 더 높았습니다.

이 결과는 다소 특이합니다. Macformer는 훈련 세트에 존재하지 않는 연결을 추론할 수 있는 반면, MacLS는 이러한 기능이 없습니다. 이를 위해 연구진은 UMAP(통합 매니폴드 근사 및 투영 알고리즘)을 사용하여 데이터의 차원을 줄였습니다. 결과는 다음과 같습니다Macformer가 생성한 새로운 링커는 ChEMBL 훈련 세트 근처에 분포되어 있습니다..
실험적 검증
약물 개발:푸조티닙의 거대고리화
최근 몇 년 동안 거대고리 화합물은 잠재적인 키나제 억제제로서 많은 주목을 받았습니다. 연구진은 모델의 예측 성능을 검증하기 위해 Macformer를 사용하여 JAK2 억제제를 설계했습니다. JAK2는 JAK 계열의 키나제에 속하며 골수증식성 신생물과 류마티스 관절염 치료에 중요한 표적입니다.
모델의 입력값은 골수섬유증을 치료하는 데 사용되는 소분자 약물인 푸조티닙이었습니다. 필트라티닙은 다른 JAK 키나제보다 JAK2에 대한 선택성이 더 뛰어나지만, 다른 키나제에 대한 선택성이 낮아 다른 부작용을 유발합니다.
거대고리화를 위한 부착 지점은 말단의 페닐 고리 2개로 설정되었고, Asp994 표적 부위와의 접촉에 해로울 수 있는 tert-부틸 잔타마이드는 제거되었습니다. 예측되는 거대고리 약물의 다양성을 높이기 위해 각 소스 SMILES 시퀀스를 10배 확장했습니다.결국 Macformer는 281개의 새로운 거대고리 약물을 포함하여 10,700개의 결과를 산출했습니다..

연구진은 거대고리 약물의 표적 결합과 합성 가능성을 평가한 후, 최종적으로 합성 평가 테스트를 위해 세 가지 화합물을 선택했습니다.그 중, 화합물 1의 링커는 거대고리 약물의 설계나 JAK2 억제제의 개발에 보고된 바가 없습니다..
MacLS가 설계한 300개의 거대고리 약물 중이 3가지 화합물은 발견되지 않았습니다.이는 새로운 약물 설계에 있어서 딥러닝 알고리즘의 잠재력을 다시 한번 입증한 것입니다.
시험관 내 평가:효소 및 세포 수준의 활동
이후, 이 세 가지 화합물의 JAK2에 대한 활성이 평가되었습니다.반감기 억제 농도(IC50)는 각각 0.07, 0.364 및 0.006 μM이었습니다. . 가장 강력한 화합물 1과 3을 100μM에서 특이성을 평가한 결과, 각각 10개와 17개의 야생형 키나제만 억제된 반면, 페리티닙은 34개의 야생형 키나제에 영향을 미쳐 화합물 1과 3이 더 선택적임을 나타냈습니다.

한편, JAK2 의존 세포에 대한 화합물 1~3의 항증식 특성도 평가되었습니다. 결과는 다음과 같습니다화합물 1과 3은 fuzotinib보다 낮은 용량으로 JAK2 의존 세포의 증식을 억제할 수 있습니다..
생체 내 평가:약동학 시험
마지막으로, 화합물 1, 3 및 푸제티닙의 약동학(PK)은 정맥 주사(iv, 5 mg/kg) 및 경구(po, 5 mg/kg) 투여 후 연구되었습니다.
Compound 3은 생물학적 이용가능성을 제외한 모든 측면에서 fuzotinib보다 우수했습니다(9.4% 대 11.7%). 동시에, 화합물 1은 전신 노출(106.00 대 50.19 h*ng/mL) 및 생물학적 이용 가능성(14.1% 대 11.7%)과 같은 경구 특성 면에서도 장점이 있습니다. 위의 결과는 다음을 보여줍니다.거대고리화는 푸조티닙 계열 약물의 대사 안정성을 개선하는 데 유익합니다..

생체 내 테스트:화합물 3은 염증을 억제합니다
JAK2의 과잉발현은 염증성 장 질환(IBD)으로 이어질 수 있다는 보고가 있으며, 이는 JAK2의 활동을 억제하는 것이 IBD 치료에 도움이 될 수 있음을 의미합니다.연구진은 염증성 장 질환 치료에 있어서 거대고리 약물의 역할을 평가하기 위해 마우스 모델에서 거대고리 약물을 테스트했습니다.
약동학 시험 결과에 따르면, 페이조티닙의 투여량은 화합물 3의 2배였습니다. 그 결과, 화합물 3과 푸제티닙 모두 IDB로 인한 체중 감소를 완화시켰으며, 실험군의 질병 활성 지수는 8일차부터 유의미하게 감소했습니다.
마지막으로 HE 염색을 사용하여 염증의 심각도를 분석했습니다. 대조군은 염증 세포 침윤 및 잔세포 손실을 포함한 상당한 염증 반응을 보인 반면, 실험군에서의 염증 반응은 더 약했고 대장 구조는 손상되지 않았습니다.

위의 결과는 맥포르머가 추론한 거대고리 화합물이 기존 약물보다 약동학 및 선택성 면에서 우수하며, 더 낮은 용량으로 질병 치료를 달성할 수 있음을 보여줍니다.
효능은 높고 합성은 어렵고 거대고리의 희로애락
2020년 현재,미국 식품의약국(FDA)은 67종의 거대고리약을 승인했는데, 이는 승인된 전체 약물의 41%를 차지합니다. . 그 중 59개는 천연 거대고리 약물이고, 단 8개만이 비천연 약물입니다. 2008년에 FDA는 최초의 비천연 거대고리 약물인 플레릭사포르를 암 치료제로 승인했습니다.
거대고리 약물의 주요 적응증은 감염성 질환으로 44.4%를 차지하고, 그 다음으로 종양(20.8%)과 항진균제(8.3%)가 뒤따릅니다. 최근 몇 년 동안 항암 분야에서 거대고리 약물의 사용이 극적으로 증가했습니다. 2007년 이전에는 4개만 있었지만, 그 이후로 11개가 승인되었습니다.

거대고리 약물은 반경화되고 미리 조직화된 구조로 다양한 기능과 복잡한 화학 구조를 제공할 수 있어, 기존 소분자가 결합하기 어려운 표적에 대한 거대고리 약물의 친화성과 선택성을 높여 약물 효능을 개선할 수 있습니다. 게다가 일부 거대고리 약물은 외부 환경에 적응하기 위해 구조를 조절할 수 있습니다. 이러한 능력은 수용성과 세포 투과성을 증가시킵니다.
하지만,거대고리약의 합성은 매우 복잡하다. 거대고리 구조는 특정 표적에 결합하는 능력을 향상시키는 반면, 고리 변형, 공간적 상호작용, 비공유 결합 교차고리 상호작용으로 이어진다.이로 인해 분자 구조와 특성을 예측하기가 더 어려워졌습니다..
약물 개발에 AI를 활용하는 것이 점점 더 보편화되고 있습니다. 그러나 제한된 데이터로 인해 AI의 성능이 제한되는 경우가 많습니다. 이 연구에서는연구원들은 무작위 SMILES 표현을 사용하여 데이터 증강을 수행했습니다.데이터 세트의 풍부함을 보장하는 동시에 Macformer의 예측 성능이 향상되었습니다.
앞으로 사람들이 약물의 구조와 성질에 대해 더 깊이 이해하게 되면서 AI는 새로운 약물 개발에 더욱 적극적으로 참여하여 사람들의 건강을 보호할 것입니다.
참조 링크:
[1]https://www.cambridgemedchemconsulting.com/resources/hit_identification/macrocycles/macrocycles.html
[2]https://pubs.acs.org/doi/10.1021/acs.jmedchem.3c00134