약물 내성균에 감염된 환자에게 좋은 소식입니다! 맥마스터 대학교와 스탠포드 대학교, 생성 AI를 활용한 새로운 항생제 공동 개발

알렉산더 플레밍이 1928년에 페니실린을 발견한 이래, 인류 의학 역사상 가장 중요한 발견 중 하나인 항생제는 현대 의학에 혁명을 일으켰습니다. 그러나 실제 진단 및 치료에서는항생제 남용이 점점 더 심각해지고 있습니다.이런 현상은 감독이 느슨한 일부 3, 4선 도시에서 특히 두드러지며, 이로 인해 박테리아의 약물 내성이 생기기도 합니다.
2022년 The Lancet에 발표된 연구에 따르면2019년에는 약제 내성 세균 감염으로 인해 약 500만 명이 사망했으며, 2050년까지는 그 수가 1,000만 명에 달할 것으로 예상됩니다.같은 연구에 따르면 항생제 내성(AMR)은 현재 심장병과 뇌졸중에 이어 전 세계적으로 세 번째로 높은 사망 원인이 되었으며, HIV/AIDS, 유방암, 말라리아로 인한 사망률을 넘어섰습니다.
세균 내성 문제에 직면하여, 항생제 남용을 엄격히 통제하는 한편, 새로운 구조를 가진 항생제의 연구 개발을 가속화하는 것이 필수적입니다. 오늘날 인공지능 방법은 새로운 항생제를 발견하는 데 도움이 되지만 여전히 많은 한계가 있습니다. 예를 들어, 분자의 구체적인 속성을 평가하는 예측 모델은 대규모 화학 공간에는 잘 적용되지 않습니다.
이 문제를 해결하기 위해 맥마스터 대학과 스탠퍼드 대학의 연구진은 Nature의 자회사인 Nature Machine Intelligence에 "합성이 쉽고 구조적으로 새로운 항생제를 설계하고 검증하기 위한 생성적 AI"라는 제목의 논문을 발표했습니다.
이 연구에서는 약 300억 개 분자의 화학 공간을 기반으로 새로운, 쉽게 합성되는 화합물을 설계할 수 있는 새로운 생성 인공지능 모델인 SyntheMol을 개발했습니다.연구팀은 SyntheMol을 사용하여 슈퍼박테리아 아시네토박터 바우마니(A. baumannii)의 성장을 억제할 수 있는 분자를 설계했습니다. 그들은 58개의 분자를 합성하였고, 그 중 새로운 구조를 가진 6개가 A. baumannii와 다른 세균 병원균에 대해 항균 활성을 보인다는 것을 확인했습니다.
연구 하이라이트:
* 생성형 AI 모델인 SyntheMol은 약 300억 개의 분자로 구성된 화학 공간에서 쉽게 합성할 수 있는 새로운 화합물을 설계할 수 있습니다.
* 이 모델은 새로운 약물 구조를 생성할 뿐만 아니라 화학 합성에 대한 자세한 공식도 제공합니다.
* 실험 결과는 생성 AI가 광범위한 화학 공간에서 새롭고 합성 가능하며 효과적인 소분자 항생제 후보를 설계할 수 있는 잠재력이 있음을 보여줍니다.

서류 주소:
https://www.nature.com/articles/s42256-024-00809-7
공식 계정을 팔로우하고 "합성 항생제"라고 답글을 달면 전체 PDF를 받을 수 있습니다.
데이터 세트: 13,524개의 고유 분자 포함
이 연구에서는 먼저 세 가지 다른 화학 라이브러리에 대한 물리적 스크리닝을 수행하여 훈련 데이터 세트로 사용했습니다.
화학 라이브러리 1에는 Pharmakon-1760 라이브러리의 2,371개 분자(FDA 승인 약물 360개, 국제적으로 승인된 약물 400개)와 식물, 동물, 미생물에서 분리한 천연물 800개가 포함되어 있습니다.
Chemical Library 2는 6,680개의 분자를 포함하는 Broad Drug Repurposing Hub 데이터베이스로, 이 중 대부분은 FDA 승인을 받은 약물이거나 임상 시험 후보입니다.
화학 라이브러리 3은 브로드 연구소의 대규모 화학 라이브러리에서 무작위로 샘플링한 5,376개 분자로 구성된 합성 소분자 스크리닝 세트입니다.
연구진은 각 데이터베이스에 대해 두 번의 생물학적 반복 실험을 수행하고 각 화합물에 대한 평균 표준화된 OD600 값을 계산했습니다. 또한 이들은 이러한 OD600 값의 평균 μ와 표준 편차 σ를 계산한 다음 임계값 μ − 2σ를 사용하여 이러한 값을 이진화하고 임계값 아래의 모든 값을 활성으로 표시하고 임계값과 같거나 위의 모든 값을 비활성으로 표시했습니다. 그런 다음 연구진은 이진화된 세 개의 라이브러리를 병합하고 충돌하는 활동 태그가 있는 중복 화합물을 제거했습니다.
위의 처리 후,최종 데이터 세트에는 13,524개의 고유 분자가 포함되어 있으며, 그 중 470개(3.5%)는 활성 화합물이고 13,054개(96.5%)는 비활성 화합물이었습니다.
모델 아키텍처: 속성 예측 모델을 기반으로 한 몬테카를로 트리 탐색
슈퍼박테리아인 A. Baumannii는 "근절하기 어려운" 것으로 알려져 있으며 폐렴, 수막염 및 상처 감염을 일으킬 수 있습니다. 세계보건기구(WHO)는 이를 세계에서 가장 위험한 항생제 내성 박테리아 중 하나로 지정했습니다. 그러므로,실험은 이 슈퍼박테리아를 표적으로 삼는 잠재적인 항생제 후보 화합물을 중심으로 진행되었습니다.

위에 나타낸 바와 같이, 연구진은 먼저 약 13,000개의 분자로 구성된 훈련 세트를 스크리닝하고 성장 억제 시험을 수행하여 A. baumannii에 대한 생물학적 활성을 확인했습니다.그런 다음 이러한 스크리닝 데이터를 사용하여 항균 활동을 예측하는 속성 예측 모델을 학습했습니다.
분자를 생성하려면연구진은 약 300억 개의 분자로 구성된 화학 공간을 선택했습니다.각 분자는 약 132,000개의 구성 요소에서 2~3개의 분자를 결합하는 13가지 화학 반응 중 하나를 통해 합성될 수 있습니다.
생성적 AI 모델 SyntheMol은 속성 예측 모델에 따라 몬테카를로 트리 탐색(MCTS)을 사용하여 광대한 조합 화학 공간을 탐색합니다.A. baumannii에 대해 활성을 갖는 유망한 항생제 후보 화합물을 검색합니다.
각 MCTS 확장에서 SyntheMol은 루트를 선택하고 이를 반응과 결합하여 분자를 구축합니다. 생성된 분자는 속성 예측 모델에 의해 평가되고 MCTS 알고리즘에 피드백을 제공합니다. MCTS가 전개됨에 따라 SyntheMol은 어떤 루트와 반응의 조합이 높은 속성 예측 점수를 가진 분자를 생성하는지 학습합니다. 다음 그림과 같이:

일련의 확장을 거친 후, SyntheMol은 각 분자를 합성하는 데 필요한 특정 합성 계획과 함께 생성된 모든 화합물을 출력합니다. 여기에는 루트와 반응의 순서도 포함됩니다.
연구진은 20,000번의 반복 실험을 거쳐 새로운 구조와 다양한 종류를 지닌 높은 점수를 받은 화합물 그룹을 선별했습니다.이 화합물은 합성되어 계통학적으로 다양한 박테리아 종에 대해 시험관 내에서 실험적으로 테스트되었습니다.
연구 결과: SyntheMol은 화학자들이 항생제를 합성하고 제형을 만드는 데 도움이 됩니다.
실험에서 연구진은 SyntheMol을 적용하여 항생제 특성 예측 모델을 사용하여 A. baumannii에 대한 잠재적인 항생제 후보 화합물을 발견했으며, 주로 SyntheMol 내의 Chemprop을 사용하여 결과를 발표했습니다.
20,000건의 MCTS 배포 과정(8.5시간 미만)에서SyntheMol과 Chemprop은 4억 5,200만 개의 중간 노드를 평가했습니다.다양한 분자 구성 요소의 조합을 포함하고 24,335개의 완전한 분자를 생성합니다.이들 중 2,868명은 Chemprop 항균제 예측 점수가 최소 0.5점이었습니다. 이 방법은 Chemprop이 무작위로 샘플링한 1,000만 개의 실제 분자(8시간)에 대한 점수를 매기고 최소 0.5점의 점수를 받은 분자를 374개만 식별한 AI 기반 가상 스크리닝 방법보다 성능이 뛰어났습니다(SyntheMol의 TP3T는 131개에 불과).

Chemprop 항균제 모델 점수
SyntheMol은 모든 MCTS 확장에서 고분자를 생성했지만, 이러한 고분자는 주로 초기 확장에 집중되었습니다. 첫 2,000번의 확장에서 2,868개(36%)의 Chemprops가 생성되었고, 그 중 1,035개(10%)는 최소 0.5점의 점수를 받았습니다. 20,000번의 확장을 통해 약 300억 개의 분자의 화학 공간 중 일부만 탐색했지만 이러한 결과는SyntheMol은 빠르게 최고 점수를 받은 화합물을 다수 생성했습니다.
연구진은 박테리아를 죽일 가능성이 가장 높은 화합물 70개를 선정하고 우크라이나 화학 회사인 에나민과 협력하여 이를 합성했습니다. 이 회사는 이러한 화합물 58개를 효율적으로 생산할 수 있었고, 연구진은 이 58개 화합물의 A. baumannii에 대한 생물학적 활성을 추가로 검증했습니다. 실험 결과는 다음과 같습니다.아래 그림에 나타난 6개의 분자(에나민 10, 23, 28, 31, 40 및 43)는 우수한 항균 활성을 보였습니다.즉, 최소 억제 농도(MIC)는 ≤ 8 μg ml−1이었습니다. 이는 10%의 적중률을 나타내며, 훈련 세트의 3.5% 적중률보다 거의 3배 높습니다.

또한,이 여섯 가지의 새로운 분자는 또한 여러 다른 계통발생학적으로 다른 세균 병원체(클렙시엘라 뉴모니아, 메티실린 내성 황색포도상구균 등)에 대해서도 항균 효능을 보였습니다.구체적으로, SPR 741이나 콜리스틴과 같은 외막 교란제와 함께 사용했을 때, 6가지 분자 모두 바실러스 바우마니, 대장균, 클렙시엘라 뉴모니아를 포함한 여러 그람 음성 세균에 대해 광범위한 활성을 보였으며, 분자 중 하나인 에나민 40은 또한 녹농균에 대해서도 활성을 보였습니다.
단일제제로서 이들 분자는 그람 양성균인 메티실린 내성 황색포도상구균과 그람 음성균인 LPS 결핍 및 콜리스틴 내성 B. baumannii의 성장을 억제했습니다. 실험 결과는 아래 그림과 같습니다.

현재,SyntheMol 모델에도 몇 가지 단점이 있습니다. 높은 수용성을 지닌 분자를 생성하도록 프로그램되지 않았습니다. 6가지 항균 분자 중 4가지는 물에 충분히 녹지 않았고, 그중 2가지만 마우스 모델에서 독성을 테스트할 수 있었습니다.
생성된 분자를 실행 가능한 항생제 후보로 전환하고 합성 가능한 분자를 설계하기 위한 생성적 AI 접근 방식을 개선하기 위해서는 더 많은 연구가 필요하지만, 이번 연구 결과는 생성적 AI가 광범위한 화학 분야에서 구조적으로 새롭고 합성 가능하며 강력한 소분자 항생제 후보를 설계할 수 있는 잠재력을 보여준다.
더 강조할 가치가 있는 것은이 모델은 새로운 약물 구조를 만들어낼 뿐만 아니라 화학 합성에 대한 자세한 레시피를 제공하여 화학자들이 실험실에서 이러한 약물을 합성할 수 있도록 해줍니다.
AI+항생제 연구개발로 획기적인 진전 이뤄
전 세계의 과학자, 공중 보건 기관 및 정부는 항생제 내성이 다음번의 주요 세계적 건강 위기가 될 것이라고 경고하고 있습니다. 1960년대 이후로 박테리아와 특정 미생물이 항생제에 대한 내성을 갖게 되었고 이로 인해 사망자 수가 늘어나고 있습니다.
새로운 항균제에 대한 수요는 증가하고 있지만, 실제로 개발된 새로운 항생제는 소수에 불과합니다. 한편 항생제 개발에는 오랜 시간이 걸리고, 전통적으로과학자들이 새로운 항생제를 개발하는 데는 약 12년이 걸리고, 임상적 후보물질을 발견하는 데는 3~6년이 더 걸립니다.반면, 항생제의 연구 개발로 인한 수익이 낮아지면서 많은 대형 제약회사가 시장에서 철수했습니다.2017년 항생제 개발 비용은 약 15억 달러로 추산되었습니다. 그러나 그렇게 높은 비용에 비해 항생제는 매년 제약 회사에 4,600만 달러의 수익만 가져다줄 수 있습니다. 수익과 비용만 고려한다면 투자금을 회수하는 데 약 32년이 걸릴 것입니다.
오늘날 인공지능 기술의 급속한 발전으로 항생제 연구 개발에 새로운 획기적인 진전과 길이 열렸습니다.
2020년 초, MIT 과학자들이 딥러닝 모델을 사용하여 발견한 "할리신" 항생제 분자는 전례 없는 광범위 항균 능력을 보여주었습니다.인공지능 방법을 전적으로 사용해 새로운 항생제를 발견한 것은 이번이 처음이다.연구자들은 생명과학 분야의 대표적인 저널인 Cell에 게재된 연구에 따르면, 할리신이 세계에서 가장 위험한 박테리아 중 일부를 죽일 수 있다고 밝혔습니다.
2023년 6월, 캐나다 맥마스터 대학교와 매사추세츠 공과대학교의 연구진은 공동으로 Nature Chemical Biology 저널에 "아시네토박터 바우마니를 표적으로 하는 항생제의 딥러닝 기반 발견"이라는 제목의 연구 논문을 발표했습니다. 연구팀은 인공지능 알고리즘을 사용하여새로운 항생제인 아바우신이 중요한 약물 내성 세균인 A. baumannii를 특이적으로 죽일 수 있는 것으로 발견되었습니다.연구팀은 또한 이 AI 모델을 사용하여 황색포도상구균, 녹농균 등 다른 중요한 약물 내성 세균에 대한 항생제를 식별할 계획입니다. (자세한 해석은 여기를 클릭하세요: AI가 슈퍼박테리아와 싸운다: 맥마스터 대학교, 딥러닝을 활용해 새로운 항생제 아바우신 발견)

2023년 12월, MIT 연구진은 항생제를 발견하기 위한 딥러닝 방법을 개발했습니다.대규모 화학 라이브러리에서 잠재적인 항생제를 식별하기 위해 그래프 신경망 Chemprop을 사용하여 새로운 종류의 항생제가 발견되었습니다.이 제품은 특히 중요한 약물 내성 박테리아인 A. Baumannii를 죽일 수 있습니다. (자세한 해석은 여기를 클릭하세요: "슈퍼박테리아"의 저주가 깨질 수도, MIT가 딥러닝을 활용해 새로운 항생제를 발견)
위에서 언급한 연구에는 약물 내성 박테리아인 A. Baumannii를 표적으로 삼은 사례도 포함되었지만, 생성적 AI는 사용되지 않았다는 점은 주목할 만합니다. 기존 AI 방식과 비교했을 때,이 연구의 생성 AI 모델은 후보 항생제 분자를 직접 설계하고 광대한 화학 공간을 빠르게 탐색할 수 있습니다.
국내 학계에서는 2022년 6월 중국과학원 미생물학연구소 연구진이 "딥러닝을 이용한 인간 장내 미생물 군집의 항균 펩타이드 식별"이라는 제목의 연구 논문을 발표했습니다.항균 특성을 가진 펩타이드를 찾기 위해 대규모 장내 미생물군 데이터 세트를 효율적으로 채굴하기 위해 인공지능을 사용하는 방법이 설명되어 있습니다.연구진은 검색된 4,409개의 대표적 유전체에서 2,349개의 후보 AMP를 선별하고, 유전자 발현 데이터, 상대적 풍부도, 선택된 박테리아와의 연관성을 통해 241개의 항균 펩타이드 서열을 추가로 식별했습니다. 그들은 216개의 펩타이드를 최종적으로 합성했는데, 그 중 181개는 항균 활성을 가지고 있었고, 적중률은 83.8%였습니다. 이는 머신 러닝 모델이 새로운 항생제 발견의 진행을 효과적으로 가속화할 수 있음을 강력하게 보여주는 결과입니다.
같은 해,시안교통대학교 제1부속병원의 류빙 교수는 화웨이 클라우드 판구 약물 분자 빅모델을 기반으로 한 AI 지원 약물 설계 서비스를 사용하여 슈퍼 항균제 약물 Drug X를 개발하는 데 성공했습니다.이 약물은 미생물의 히스톤 HU를 표적으로 삼고 박테리아 DNA 복제를 억제함으로써 항균 효과를 얻습니다. 세균 히스톤 HU를 표적으로 하는 파지가 암호화하는 항균 억제제가 발견된 것은 세계 최초이다. 관련 연구는 "박테리오파지 단백질 Gp46은 핵소체 관련 HU 단백질의 종간 억제제이다"라는 제목으로 미국 국립과학원 회보에 게재되었습니다.
산업 측면에서는국내 주요 항생제 생산기업으로는 루강제약, 화북제약, 커룬제약, 하얼빈제약그룹, 촨닝생물 등이 있으며, 해외기업으로는 사노피, 노바티스 등이 있습니다.많은 기업이 AI를 도입해 사업을 최적화하겠다고 분명히 밝혔습니다.
예를 들어, 트와이닝스 바이오파마는 상하이 진윈 테크놀로지(Shanghai Jinyun Technology Co., Ltd.)와 전략적 파트너십을 체결하여 AI를 활용하여 합성생물학 연구 및 개발을 지원하고, 생산 방법과 효율성을 개선하기 위한 신제품을 공동 개발하고 있습니다. 2023년, 사노피는 "인공지능과 데이터 과학을 모두 아우르는" 전략을 발표하고 BioMap BioScience와 협력하여 BioMap의 인공지능 플랫폼을 활용해 생물학적 치료제 발굴을 위한 최첨단 AI 모듈을 공동 개발하기로 했습니다.
물론 항생제 분자의 발견은 약물 발견 분야에서 AI 기술이 적용된 사례의 빙산의 일각에 불과합니다. 현재 전 세계 학자들은 인공지능 기술을 활용해 약물 연구개발 비용을 절감하고, 연구개발 기간을 단축하며, 연구개발 효율성을 높이고, 신약 개발을 빠르고 효율적으로 만들기 위해 노력하고 있습니다.
참고문헌:
1.https://www.thepaper.cn/newsDetail_forward_20092860
2.https://www.chinagut.cn/articles/ss/a5871d7d61f64fdc9d902e34520654c7
3.https://www.sohu.com/a/374972885_498729
4.https://www.most.gov.cn/gnwkjdt/202206/t20220614_181127.html