HyperAI초신경

펜실베이니아 대학은 동물 독에서 386개의 새로운 항균 펩타이드를 발견하고 잠재적인 항생제 후보물질을 선별하기 위해 딥러닝 모델인 APEX를 개발했습니다.

特色图像

1928년 페니실린의 발견은 인류의 세균 감염 퇴치에 새로운 시대를 열었습니다. 이 항생제들은 인류의 감염성 질환 퇴치 능력을 크게 향상시켰습니다. 그러나 의학과 농업 분야에서 항생제의 광범위한 사용과 과도한 사용으로 인해 세균 내성이 생겨났고, 이는 놀라운 속도로 악화되고 있습니다.

21세기에 접어들면서 항생제 내성은 세계 공중 보건 분야의 주요 과제로 떠올랐습니다. 세계보건기구(WHO)의 자료에 따르면, 전 세계적으로 매년 약 500만 명이 약제 내성 감염으로 직간접적으로 사망하고 있으며, 이러한 위기의 핵심 원인은 항생제 내성 병원균의 급속한 성장과 확산입니다. 그중에서도 WHO가 "우선순위 병원균"으로 지정한 그람 음성균은 특히 심각한 문제입니다. 강력한 약제 내성 진화 능력을 가진 이 세균들은 인간과의 "항균 전쟁"에서 여전히 우위를 점하고 있습니다. 더욱 심각한 것은 지난 수십 년 동안새로운 항생제의 연구 개발은 정체되어 있습니다. 높은 R&D 비용과 긴 임상 시험 주기로 인해 많은 제약 회사들이 이 분야 진출을 꺼리고 있습니다. 새로운 항생제의 수는 급격히 감소하여 약물 내성균의 진화 속도에 크게 뒤처졌습니다.

이러한 딜레마에 직면한 과학자들은 자연 속 잠재적인 "보물 창고"인 동물 독에 관심을 돌리기 시작했습니다. 수백만 년에 걸친 자연 진화를 거쳐 동물 독은 생리활성 펩타이드와 단백질을 포함하여 매우 풍부한 분자적 다양성을 낳았습니다.이 물질은 광범위한 생물학적 표적과 상호작용할 수 있을 뿐만 아니라, 상당한 항균 활성도 나타냅니다.실제로, 생물의학 분야에서 독의 응용은 이미 확고한 성공 사례입니다. 청록달팽이 독에서 추출한 지코노타이드(상품명 프리알트®)는 만성 통증 치료에 중요한 진통제로 자리 잡았으며, 뱀독에서 개발된 캡토프릴은 임상에서 흔히 사용되는 항고혈압제입니다. 이러한 사례들은 항균 분야에서 독의 활용에 대한 중요한 통찰력을 제공합니다.

이러한 맥락에서,미국 펜실베이니아 대학의 연구팀은 전 세계의 독 단백질에서 항균 후보 펩타이드를 고처리량 방식으로 선별한 결과, 전 세계 동물 독에서 새로운 구조를 가진 항균 펩타이드 386개를 발견했습니다.그 중 실험적으로 검증된 분자인 91.4%는 강력한 항균 활성을 보였으며, 이는 차세대 항생제 발견을 위한 획기적인 아이디어를 제공했습니다.

관련 연구 결과는 "Venomics 인공지능을 활용한 항균제 발견을 위한 전 세계 독의 계산적 탐색"이라는 제목으로 Nature Communications에 게재되었습니다.

연구 하이라이트:

* 이 연구에서는 글로벌 독 데이터베이스를 구축하고 암호화된 펩타이드의 후보 라이브러리를 생성했습니다. 여기에는 총 16,123개의 독 단백질이 포함되었으며 4,000만 개 이상의 독 암호화 펩타이드가 생성되었습니다. 

* 이 연구에서는 딥러닝 모델 APEX를 사용하여 34가지 박테리아 종에 대한 각 펩타이드의 최소 억제 농도를 예측하고, 궁극적으로 항균 잠재력이 있고 알려진 AMP와 서열 유사성이 낮은 386개의 후보 펩타이드를 선별했습니다.

* 연구팀은 386개의 VEP로부터 58개의 펩타이드를 합성하여 테스트하였으며, 그 중 91.4%(53)가 적어도 하나의 병원체에 대해 유의미한 억제효과를 가지는 것으로 나타났다.

서류 주소:

https://www.nature.com/articles/s41467-025-60051-6[*](https://arxiv.org/pdf/2507.09466*)

공식 계정을 팔로우하고 "APEX"라고 답글을 달면 전체 PDF를 받을 수 있습니다.

데이터베이스: 16,000개의 독 단백질 컬렉션

새로운 항균제 후보 물질을 발굴하기 위해 본 연구는 ConoServer, ArachnoServer, ISOB, VenomZone 등 네 개의 데이터베이스에서 독 단백질 서열을 수집하여 총 16,123개의 독 단백질을 확보했습니다. ConoServer는 코노펩타이드에, ArachnoServer는 거미 독소에, ISOB는 방글라데시 토종 뱀의 독에 대한 데이터베이스이며, UniProtKB에서 수집된 VenomZone은 뱀, 전갈, 거미, 청록달팽이, 말미잘, 곤충 등 여섯 가지 분류군의 단백질을 포함하고 있으며, 본 연구에서는 UniProt이 이를 담당했습니다.

각 데이터 세트는 고유한 특성과 용도를 가지고 있습니다. 아래 그림에서 볼 수 있듯이, 여러 데이터베이스의 종 중복 분석 결과 UniProt이 가장 많은 고유 종을 보유하고 있으며, 699개에 달하여 단백질 다양성이 더 넓음을 보여줍니다. 반면 ConoServer와 ArachnoServer는 상대적으로 적은 수의 고유 종을 포함하는 반면, ISOB는 고유 종이 전혀 없습니다.이러한 다양성 덕분에 연구자들은 독 속의 항균 펩타이드를 여러 각도에서 탐구하고, 다양한 출처의 단백질 정보를 통합하고, 새로운 항균 펩타이드를 발견할 가능성을 높일 수 있습니다.

4대 주요 데이터베이스의 벤 다이어그램

아래 그림에서 볼 수 있듯이, 연구진은 이러한 독 단백질을 처리하여 4천만 개 이상의 독 암호화 펩타이드(VEP)를 생성했습니다. 그런 다음 APEX 딥러닝 모델을 사용하여 이러한 펩타이드의 항균 활성을 예측하고, 각 펩타이드의 세균 균주에 대한 최소 저해 농도(MIC) 값을 추정했으며, MIC 중앙값을 항균 활성 척도로 사용했습니다. 추가 스크리닝을 통해 연구진은 최종적으로 MIC 중앙값 ≤ 32 μmol L⁻¹인 7,379개의 VEP를 확인했습니다. 기존 항균 펩타이드와의 서열 유사성을 필터링한 후, 386개의 후보 물질을 발견했습니다. 이러한 후보 물질들은 기존 항균 펩타이드와 구조적, 기능적으로 차이가 있어, 후속 실험 검증을 위한 귀중한 표적을 제공합니다.

APEX 모델 예측: 다중 소스 독 프로테옴 데이터 통합 및 항균 후보 펩타이드 스크리닝 프로세스

APEX 모델은 항균 펩타이드의 잠재적 채굴과 예측에 초점을 맞춘 딥러닝 도구입니다.이 모델의 핵심 장점은 특정 박테리아 균주에 대한 항균 활성을 예측할 수 있다는 것입니다. 체계적인 학습을 통해, 이 모델은 항균제 효능 측정의 핵심 지표인 34가지 박테리아 균주에 대한 펩타이드의 최소 저해 농도(MIC) 값을 정확하게 예측할 수 있습니다.

모델의 학습 데이터 세트는 두 부분으로 구성됩니다.DBAASP 데이터베이스에서 얻은 내부적으로 축적된 펩타이드 서열 데이터와 공개 항균 펩타이드(AMP) 정보입니다.이러한 다양한 데이터 지원을 통해 APEX는 펩타이드 시퀀스와 항균 활성 간의 복잡한 매핑 관계를 분석하는 데 탁월한 성능을 발휘하여 후속 스크리닝을 위한 견고한 알고리즘 기반을 마련합니다.

건축 설계 측면에서 APEX는 다목적 작업 모델 프레임워크와 "3단계" 전략을 채택하여 독 단백질에서 항균 펩타이드 후보 분자를 스크리닝합니다.첫 번째,슬라이딩 윈도우 방법을 사용하여 펩타이드 라이브러리를 구축하였고, 8~50개 아미노산 길이의 단편을 선택했습니다.둘째,APEX 모델은 다양한 세균 균주에 대한 이들 펩타이드의 최소 억제 농도(MIC)를 예측하는 데 사용되었습니다.마침내,서열 유사성에 따른 추가 선택을 통해 새로운 구조와 뛰어난 활성을 지닌 독 암호화 펩타이드(VEP) 그룹이 탄생했습니다.

항균 펩타이드(AMP)를 위한 채굴 프레임워크

이 설계는 대량의 독 암호화 펩타이드(VEP) 처리 시 잠재적인 항균 활성을 가진 후보 분자를 정확하게 식별할 수 있도록 합니다. 기존의 실험적 스크리닝 방법과 비교하여 APEX는 항균 펩타이드 발굴 효율성을 크게 향상하는 동시에 자원 집약적인 생화학 분석에 대한 의존도를 줄여 연구자들에게 더 빠르고 경제적인 스크리닝 경로를 제공합니다.

실제 응용 프로그램에서 APEX 모델을 사용하려면 특정 기술적 준비가 필요합니다. 연구자는 Python 3.9, 특정 버전의 PyTorch, 그리고 numpy, scipy, matplotlib과 같은 일련의 종속 라이브러리를 설치하는 등 적절한 런타임 환경을 설정해야 합니다. 환경이 설정되면 후보 펩타이드 서열이 텍스트 파일에 저장됩니다. 지정된 명령을 실행하면 모델은 MIC 예측 결과가 포함된 CSV 파일을 생성합니다. 이러한 예측을 분석함으로써 연구자는 추가 실험 검증을 위해 항균 잠재력이 높은 펩타이드를 신속하게 식별할 수 있습니다.

VEP의 항균 활성 검증 및 작용 기전 분석

연구팀은 독이 암호화된 펩타이드(VEP)의 항균 활성을 확인하기 위해 일련의 실험을 수행했습니다.항균 활성 시험에서는 58개의 VEP가 다양한 병원균에 대해 테스트되었습니다.결과는 아래 그림에 나와 있으며, 그 중 53개(91.4%)가 적어도 하나의 병원체에 대해 활성을 보였습니다.ArachnoServer 데이터베이스의 모든 VEP는 항균 활성을 보였으며 이는 이 유형의 펩타이드의 강력한 항균 잠재력을 강력하게 확인했습니다..

독에 함유된 활성 항균제의 히트맵

그러나 UniProt 데이터베이스의 일부 VEP는 효능이 상대적으로 제한적이었습니다. 예를 들어, UniprotKB-2는 항균 활성을 나타내지 않았고, UniprotKB-6과 UniprotKB-11은 Enterococcus faecalis에 대한 억제 효과만 보였습니다. 추가 분석 결과, 이러한 저활성 펩타이드는 일반적으로 소수성과 순전하가 낮은 것으로 나타났습니다. 이는소수성과 순전하량은 펩타이드와 세균 막 사이의 상호작용을 촉진하는 데 중요한 역할을 하며, 그 수준은 VEP의 항균 효능에 직접적인 영향을 미칠 수 있습니다.

이차 구조 연구에서 연구팀은 원편광 이색성(CD) 분석을 통해 VEP의 구조 변화가 환경에 크게 의존한다는 것을 관찰했습니다. 수용액에서 VEP는 주로 무질서한 구조로 존재하지만, 모의 세균 막 환경(예: SDS 미셀 시스템)이나 나선형 유도 매질(예: 트리플루오로에탄올/물 혼합 용액)에서는 상당한 구조적 전이를 겪으며 무질서한 구조에서 α-나선으로 접힙니다. 이러한 구조적 특징은 일반적인 항균 펩타이드의 거동과 매우 일치합니다.이는 VEP가 바이오필름 관련 기능에 특별히 적응되어 있을 수 있음을 시사하며, 이는 VEP의 항균 메커니즘에 대한 중요한 단서를 제공합니다.

작용 기전 연구 측면에서, 연구팀은 형광 분석을 통해 VEP가 세균 외막과 세포질막에 미치는 영향을 평가했습니다. 결과는 아래 그림에 나와 있습니다. 23개의 VEP는 세균 외막을 효과적으로 투과할 수 있으며, 그중 Arachnoserver-18, ConoServer-6, ConoServer-7은 특히 뛰어난 투과 활성을 보였습니다. 세포질막 탈분극 실험에서, 대부분의 VEP의 탈분극 효과는 대조군보다 우수했지만, 일부 알려진 펩타이드 계열보다는 약간 약했습니다. 전반적으로,VEP의 항균 효과는 주로 세포질막 탈분극을 유도함으로써 달성됩니다. 이 기전은 기존에 알려진 여러 항균 펩타이드 및 암호화 펩타이드의 작용 기전과 일치하며, 이는 VEP가 새로운 항균제로서 그 타당성을 더욱 뒷받침합니다.

독에 대한 항균펩타이드의 작용기전 연구

학계와 산업계가 협력하여 새로운 저저항성 항균제를 탐색하고 개발합니다.

약물 내성을 유발할 가능성이 낮은 새로운 항균제를 개발하기 위해 기초 연구에서 산업 혁신에 이르기까지 학계와 기업 간의 협력적 탐구가 끊임없이 이루어지고 있으며, 이를 통해 독 항균 펩타이드의 응용 가능성이 끊임없이 확대되고 있습니다.

학계에서는 여러 나라의 연구팀이 독 항균 펩타이드의 발견, 설계 및 기전 분석에 대한 심층 연구를 수행해 왔습니다. 싱가포르 난양이공대학교의 무위광(Mu Yuguang) 연구팀은 기존 모델이 단백질 상호작용을 예측하는 데 있어 데이터의 양과 특징 차원의 제약을 받는다는 문제를 해결했습니다.지금까지 가장 큰 구조 기반 단백질 상호작용 데이터 세트를 구축했습니다.또한 ProAffinity-GNN 딥러닝 프레임워크를 개발했습니다. 이 모델은 단백질 언어 모델과 그래프 신경망을 혁신적으로 통합하여 서열 정보를 공간적 구조적 특징과 긴밀하게 결합합니다. 단백질-단백질 친화도 예측 정확도 측면에서 기존 방법을 능가할 뿐만 아니라, 강력한 일반화 기능을 통해 독 펩타이드와 박테리아 표적 간의 상호작용을 효율적으로 예측하는 기술적 패러다임을 제공합니다. 더 나아가, 작용 기전 분석은 항균 펩타이드의 최적화된 설계에 대한 이론적 근거를 제공합니다.

산둥대학 치루 의과대학 연구팀은 인공지능 분야의 확산 모델을 사용하여 자연에서 펩타이드 진화의 '무작위 섭동 지향 스크리닝' 과정을 시뮬레이션했습니다.40개의 새로운 펩타이드 서열이 성공적으로 생성되었으며, 그 중 25개는 명확한 항균 또는 항진균 활성을 보였습니다.

비즈니스 분야에서는 이스라엘의 Bountica Company가 식품 보존 분야의 문제점에 집중하고 미생물 발효 기술을 활용하여 독에서 추출한 항진균 펩타이드를 대량 생산합니다. VenomShield 시리즈 제품은빵과 주스에 곰팡이와 효모가 자라는 것을 억제하는 데는 백만분의 1만 있으면 되며, 기존 방부제보다 유통기한을 두 배 이상 연장할 수 있습니다.

중국 상하이 하이테크 바이오엔지니어링 유한회사는 복단대학교와 협력합니다.우리는 함께 세계에서 비교적 완벽한 항균 단백질 데이터베이스 3개를 구축했습니다.이러한 데이터베이스는 새로운 생물학적 항균 효소와 항균 펩타이드의 연구 개발을 위한 효율적인 도구를 제공할 뿐만 아니라, 체계적인 데이터 마이닝을 통해 약물 내성 미생물에 대한 새로운 물질 연구를 가속화합니다.

이는 기초 과학과 산업 응용 분야를 아우르는 독 항균 펩타이드 연구 및 번역의 엄청난 활력을 보여줍니다. 딥러닝 모델이 서열-기능 관계를 점점 더 정확하게 분석하고 합성 생물학 기술이 펩타이드 안정성과 발현 효율을 지속적으로 최적화함에 따라, 자연의 "생존 지혜"에서 영감을 받은 이러한 분자들은 항생제 내성 퇴치의 핵심 동력이 되어 전 세계 공중 보건에 새로운 안전 장치를 제공할 것입니다.

참고문헌:
1. https://mp.weixin.qq.com/s/lwYWWIe9-Az22jlhiZ747A
2. https://mp.weixin.qq.com/s/sGHRf-ebaSRiqGiUxMMueA
3. https://mp.weixin.qq.com/s/0mJltGuaKTUwYDGK4wD9UA
4. https://mp.weixin.qq.com/s/R6Y_-38saZwqSSow0LNhzw