AI로 농업 환경에서 E. 콜라이 항생제 저항성 예측
AI가 과학자들에게 대장균의 항생제 내성 예측을 돕다 대장균(Escherichia coli, E. coli)은 동물과 인간의 장내에서 발견되는 일반적인 세균으로, 환경에서의 배설물 오염을 확인하는 데 자주 사용됩니다. 이 세균은 항생제 내성을 쉽게 발달시킬 수 있어, 특히 배설물이 비료로 사용되거나 폐수가 재사용되는 농업 환경에서 항생제 내성 테스트에 이상적인 생물체입니다. 전통적인 실험실 방법은 항생제 내성 분석에 시간이 많이 소요되고 인력이 많이 필요하기 때문에 대규모 모니터링에는 적합하지 않습니다. 따라서 연구원들은 전장 유전체 서열 분석(WGS)과 예측 모델링을 활용한 더 빠른 접근법을 탐구하고 있습니다. 필리핀 대학교 자연과학연구소(UPD-CS NSRI)의 마르코 크리스토퍼 로페즈와 피에랑겔리 비탈 박사, 그리고 UPD 통계학과의 조셉 라잉산간 박사는 National Center for Biotechnology Information(NCBI) 데이터베이스의 유전적 정보와 실험실 테스트 결과를 사용하여 E. coli의 항생제 내성을 예측할 수 있는 다양한 인공지능(AI) 모델을 시험했습니다. "우리는 생물학적 데이터와 불균형 데이터 처리 능력이 강한 모델들을 선택했습니다," 비탈 박사는 설명했습니다. "이 모델들은 다양한 학습 전략 간의 성능을 비교하고 항생제 내성을 예측하기 가장 적합한 것을 식별하기 위해 선택되었습니다." 연구팀이 사용한 AI 예측 모델은 Random Forest(RF), Support Vector Machine(SVM), 그리고 두 가지 앙상블 방법인 Adaptive Boosting(AB)와 Extreme Gradient Boosting(XGB)였습니다. RF는 고차원 데이터 처리에 적합하며, SVM은 복잡한 결정 경계를 다루는 분류 작업에서 뛰어납니다. AB와 XGB는 정확도를 높이기 위해 어려운 샘플에 집중하는 방식으로 작동합니다. 이 AI 예측 모델들은 스트렙토마이신과 테트라시클린에 대한 내성을 가장 정확히 예측했으며, 내성 균주와 감수성 균주를 신뢰성 있게 구분할 수 있었습니다. 반면, 시프로플록사신(ciprofloxacin)은 데이터의 내성 샘플 비율이 매우 낮아(4%만 내성 샘플) 내성 식별이 어려웠고, 민감도가 낮았습니다. AB와 XGB는 불균형 항생제 내성 데이터에서도 일관성 있게 좋은 결과를 보여주었습니다. "이 전략은 특히 농업에서 항생제 내성을 실시간으로 모니터링하는 데 큰 잠재력을 가지고 있다고 생각합니다," 비탈 박사는 말했습니다. "DNA 서열화가 점점 더 빠르고 저렴해짐에 따라, 우리의 예측 모델과 같은 방법은 대발생을 초래하기 전에 내성 세균을 조기에 발견할 수 있습니다. 이는 식품 안전, 농업, 공중보건 프로그램에서 더 나은 의사결정을 가능하게 합니다." 연구원들은 더 다양한 샘플 유형과 데이터 출처—예를 들어, 모든 미생물에서 추출된 DNA인 메타게놈 데이터—를 포함하여 세균이 어떻게 내성을 발달시키는지 더 잘 이해하고 예측할 수 있도록 권장했습니다. 비탈 박사는 또한 미생물학자와 통계학자가 협력한 이번 연구의 가치를 강조했습니다. "특히 농업 식품 안전 분야에서, (미생물) 생물학적 개념을 통계와 예측 모델링에 통합하여 커뮤니티에 중요한 결과를 도출할 수 있다는 점이 중요합니다." 이 연구는 '필리핀 마닐라 수도권 주변 농업 환경에서 Escherichia coli의 항생제 내성 예측 모델'이라는 제목으로 Malaysian Journal of Microbiology에 출판될 예정입니다. DOI: 10.21161/mjm.240650 업계 전문가들은 이 연구가 항생제 내성의 실시간 모니터링과 관리를 크게 개선할 수 있는 잠재력을 가졌다고 평가합니다. 특히 빠르고 저렴한 DNA 서열화 기술의 발전으로, 이 모델들은 농업 및 공중보건 분야에서 중요한 역할을 할 것으로 기대됩니다. UPD-CS NSRI는 이러한 연구를 통해 미래의 식품 안전 및 공중보건에 기여할 수 있는 혁신적인 솔루션을 제공하고 있습니다.