싱가포르 국립대/MIT 등이 SVM 기반 미생물 오염 탐지 모델 구축, 30분 이내 결과 출력

세포치료제(CTP)는 첨단치료의약품(ATMP)의 중요한 구성 요소로서 희귀하고 치료하기 어려운 질병을 앓고 있는 환자들에게 희망을 가져다주고 있습니다. 그러나 그 생산 과정은 미생물 침입에 극도로 취약하며, 미생물 오염은 항상 이 희망의 광선 위에 안개처럼 걸려 있습니다. 반세기 동안 사용되어 온 USP <71>(미국 약전 71장에 수록된 무균 시험 방법)과 같은 전통적인 무균 시험 방법은 정밀 의학의 새로운 요구 사항을 충족시킬 수 없는 것으로 보입니다. 2주간의 배양 주기, 번거로운 전처리 단계, 주관적인 판단에 의존하는 탁도 관찰은 세포 준비의 짧은 유효 기간보다 심각하게 뒤떨어질 뿐만 아니라 잘못된 판단으로 인해 환자를 감염 위험에 노출시킬 수도 있습니다.
세포치료제의 급속한 발전으로 미생물 오염을 신속하고 정확하게 감지하는 것이 점점 더 시급해졌습니다. 혁신적인 감지 방법인 머신 러닝을 이용한 UV 흡수 분광법이 등장했습니다. 이는 광학 기술과 강력한 머신 러닝 방법을 결합한 것입니다. 많은 양의 훈련 데이터나 성장 강화 단계가 필요하지 않습니다. 단 30분 만에 소량의 샘플만으로 검사 결과를 얻을 수 있어 세포치료제의 안전성을 강력하게 보호합니다.
최근 싱가포르-MIT 연구 연합, 싱가포르 A*SRL 연구소, 싱가포르 국립대학교, 매사추세츠 공과대학교의 공동 연구팀은 자외선 흡수 분광법과 머신 러닝을 결합한 검출 방법을 제안했는데, 이를 통해 세포 배양 상층액의 미생물 오염 검출을 30분 이내에 완료할 수 있습니다. 이 방법은 단일 클래스 지원 벡터 머신(단일 클래스 SVM)을 사용하여 자외선 스펙트럼에서 니코틴아마이드와 니아신의 특성적 차이를 분석하고, 7가지 일반적인 오염 미생물을 테스트할 때 평균 진양성률 92.7%를 나타냅니다. 비정상적인 니아신 대사를 보이는 기증자 샘플을 제외한 후에도 실제 음성률은 여전히 92%에 이르며, 이는 경험에 의존하는 기존 판단의 정확성을 훌쩍 뛰어넘는 수치입니다.
관련 연구 결과는 "세포 치료 제품의 미생물 오염에 대한 머신 러닝 지원 UV 흡수 분광법"이라는 제목으로 Nature의 저널 Scientific Reports에 게재되었습니다.

서류 주소:https://hyper.ai/en/sota/papers/s41598-024-83114-y
"HyperAI Super Neural" 공개 계정을 팔로우하고 "미생물 오염 모니터링"에 답글을 남겨 전체 PDF를 받으세요.
데이터 세트: 상업용 분광기를 사용하여 수집한 무균 MSC 배양 샘플 데이터
이 연구에서 데이터 세트의 구성과 분석은 중간엽 간질 세포(MSC) 배양을 중심으로 밀접하게 이루어졌습니다. 연구팀은 MSC 치료법이 급성 조직 손상, 염증성 질환 및 만성 퇴행성 질환 치료에 널리 적용된다는 점을 감안하여 이를 시범 대상으로 선정하고, 상용 분광기를 사용하여 멸균 MSC 배양 샘플의 흡수 스펙트럼을 수집하여 이를 단일 클래스 지원 벡터 머신(단일 클래스 SVM) 모델을 학습하기 위한 기본 데이터로 활용했습니다. 이 연구에서는 스펙트럼 특성의 차이를 포착하여 세포 배양 샘플의 오염 상태를 예측하는 이상 탐지 전략을 채택했으며, 니아신(NA)과 니코틴아마이드(NAM) 대사산물 간의 스펙트럼 차이에 대한 가설을 기반으로 오염을 식별하는 SVM 모델의 잠재적 메커니즘을 탐구했습니다.
실험 동안 연구진은 기증자 A의 MSC 배양 시스템에 10 CFU의 대장균을 접종했고 21시간 후에 오염 신호를 성공적으로 검출했습니다. 7명의 상업 기증자의 샘플에 대한 검출 성능을 비교한 결과, 기증자 A가 다른 기증자의 무균 샘플을 식별하는 데 우수한 성과를 보였고, 따라서 초기 훈련 데이터의 소스로 선택되었습니다. 이후 연구에서 이 방법은 오염 수준이 10 CFU 정도로 낮은 7종의 미생물을 효과적으로 검출할 수 있었을 뿐만 아니라 교차 기증자 테스트를 통해 기술의 견고성을 검증했습니다.
본 연구에서는 SVM 모델의 성능을 심층적으로 분석하기 위해 주성분 분석(PCA) 기법을 도입했습니다. 액체크로마토그래피-질량분석법(LC-MS) 검출에서 가장 높은 NA 농도를 나타내는 녹농균 접종 시료를 연구 대상으로 사용하였다. 훈련 데이터 세트와 오염된 샘플의 분포는 PCA를 통해 시각화되었습니다. 실험 결과, 오염된 샘플과 살균된 샘플이 공간적으로 상당히 분리되어 살균 상태와 오염 상태를 효과적으로 구분할 수 있었습니다. 주성분 1(PC 1)과 주성분 2(PC 2)의 로딩 벡터를 추가로 분석하였고, PBS에서 100μg/mL NA와 NAM의 정규화된 UV 흡수 스펙트럼을 결합하여 스펙트럼 특성과 주성분 간의 연관성을 직관적으로 나타냈습니다.
모델 견고성 검증 단계에서 이 연구는 6개의 상업적 기증자(기증자 BG)로부터 폐배지와 PBS 살균 샘플을 수집하여 교차 기증자 테스트 데이터 세트를 구축했습니다. 다양한 기증자 소스에서 SVM 모델을 학습하고 교차 검증을 실시한 결과, 기증자 A와 B를 기반으로 학습한 모델의 예측 정확도가 더 높은 것으로 나타났습니다. 418개 시험 시료를 분석한 결과, 모델의 진양성률은 92.7%에 도달하였고, 검출한계는 10 CFU로 안정적으로 유지되었습니다. 그러나 77.7%의 진음성률은 여전히 개선의 여지가 있음을 나타냈으며, 그 중 기증자 F 샘플의 비정상적인 NA 수치로 인한 거짓 양성 문제가 특히 두드러졌습니다. 이는 기증자 간 대사 차이에 대한 모델의 적응성을 최적화하는 방향을 제시했습니다.
머신 러닝 지원 자외선 흡수 분광법: 핵심 알고리즘으로서의 지원 벡터 머신
기계 학습을 통해 미생물 오염 탐지를 더욱 효과적으로 지원하기 위해, 이 연구에서는 기계 학습을 자외선 흡수 분광법과 혁신적으로 결합하여 미생물 오염 탐지를 위한 빠르고 민감하며 비용 효율적인 방법을 제안했습니다. 이 방법은 SVM(Support Vector Machine)을 핵심 알고리즘으로 사용하고 세포 배양 배지의 자외선 흡수 스펙트럼 특성을 분석하여 미생물 오염을 정확하게 식별합니다.
모델 구축 측면에서 연구진은 단일 클래스 지원 벡터 머신을 사용하고 커널 함수로 방사형 기저 함수(RBF)를 선택하고, γ 값을 0.002로, ν 값을 0.2로 설정했습니다. 훈련 데이터 세트는 2, 4, 6차 통과의 2일차에서 7일차까지의 기증자 5와 기증자 8의 PBS를 첨가한 무균 샘플로 구성되었으며, 모두 무균 상태를 나타내는 1로 표시되었습니다. 각 샘플의 흡광도 데이터는 니아신(NA)과 니코틴아마이드(NAM)의 중요한 스펙트럼 특성에 초점을 맞추고 다른 대역의 노이즈로 인한 간섭을 피하기 위해 237nm에서 300nm의 파장 범위를 포괄했습니다. 모델 학습 전에 모든 샘플의 평균을 중심으로 하여 기기 드리프트와 기타 요소로 인한 스펙트럼 편차를 보정함으로써 모델의 정확도를 높였습니다.
모델 검증 및 응용 측면에서, 기계 학습을 이용한 UV 흡수 분광법을 사용하여 이 방법이 기증자 A의 MSC 배양액에 대장균 10 CFU를 첨가하고 9~24시간 사이 3시간 간격으로 상층액 샘플을 3번 추출하여 저농도 오염 물질을 검출할 수 있는 능력을 보여주었습니다. 결과는 아래 그림과 같습니다. SVM 모델은 21시간 후에 샘플이 오염되었음을 정확하게 예측할 수 있었으며, 총 감지 시간은 약 21.5시간이었습니다.

또한 이 연구에서는 머신 러닝을 이용한 UV 흡수 분광법을 기존 방법과 비교했습니다. 실험 결과, 머신 러닝을 이용한 UV 흡수 분광법은 검출 시간(TTD)이 21시간으로 USP <71> 시험법(탁도가 관찰될 때까지 24시간) 및 LC-MS를 이용한 NA/NAM 비율 계산법(18시간)과 비슷한 수준인 것으로 나타났다. 그러나 BacT/Alert® 3D와 USP <71> 모두 세포 배양에서 샘플을 추출하고 다양한 배양 농축 배지에 접종하기 위해 훈련된 작업자가 필요합니다. UV 흡수 분광법 워크플로는 비교적 간단하며 성장 농축 배지에 추가로 접종할 필요가 없고, 추가적인 배양 시간과 샘플 준비가 필요하지 않으므로 관찰된 성장 농축 접종 단계에 필요한 추가적인 리소스와 비용이 필요하지 않습니다.

제안된 머신 러닝 지원 UV 흡수 분광법 방법을 다른 미생물에 적용할 수 있는지 확인하기 위해 연구진은 공여체 A의 PBS 살균 샘플을 사용하고 황색포도상구균(S. aureus), 녹농균(P. paraeruginosa), 고초균(Bacillus subtilis, B. spizizenii), 클로스트리디움 퍼프린젠스(C. sporogenes), 칸디다 알비칸스(C. albicans), 대장균 K-12(E. coli), 프로피오니박테리움 아크네스(C. acnes)와 같은 다른 느리게 성장하는 유기체를 탐지하는 데 이 방법을 적용했으며, 탐지 한계(LoD)는 10 CFU로 낮았습니다. 또한, 이 연구에서는 주성분 분석(PCA)을 통해 SVM 모델의 성능을 시각화했으며, PCA 플롯에서 녹농균 접종 샘플과 PBS 살균 샘플이 명확히 구별되는 것을 확인했습니다. 이는 이 모델이 스펙트럼 특성의 차이를 효과적으로 포착할 수 있음을 나타냅니다.

모델 견고성 연구 측면에서, 공여체 간의 차이가 모델 성능에 영향을 미칠 수 있다는 점을 고려하여 연구진은 6개의 상업적 공여체(공여체 BG)로부터 폐배지 샘플을 수집하고 PBS로 살균한 샘플을 준비했습니다. 다양한 기증자를 기반으로 SVM 모델을 훈련하고 다른 기증자의 샘플에 대한 예측 정확도를 평가한 결과, 기증자 A와 B 모델의 평균 예측률이 더 높은 것으로 나타났습니다. 따라서 본 연구에서는 기증자 A와 B를 기반으로 학습된 SVM 모델을 나머지 6명의 기증자의 샘플에 적용했습니다. 결과에 따르면, 머신 러닝을 이용한 UV 흡수 분광법은 92.7%의 진양성률을 달성했으며, 검출 한계(LoD)는 테스트한 7가지 미생물에 대해 일관되게 10 CFU로 유지되었습니다. 그러나 모델의 실제 음성률은 77.7%였고, 거짓 양성 샘플은 주로 기증자 F로부터 나왔습니다. 분석 결과 기증자 F 샘플의 NA 수준이 더 높은 것으로 나타났는데, 이는 기증자 간 차이에 대한 적응성을 개선하기 위해 향후 모델을 더욱 최적화해야 함을 시사합니다.

AI4S는 세포 치료를 강화합니다. 과학 연구, 산업 및 정책이 시너지 효과를 발휘하며 발전합니다.
최근 몇 년 동안 과학 연구부터 사업계, 실험실부터 산업화까지 세포 치료 제품(CTP)은 큰 성공을 거두었습니다.
기초 연구 분야에서는 중국 상하이 통지대학교의 TJ-AI4S 팀이 글로벌 AI 신약 개발 알고리즘 경진대회에서 우승했습니다. 그들이 제안한 분자적 특징 확장 전략은 모델의 일반화 능력을 향상시키고 CTP 오염 물질 분자 지문 라이브러리 구축을 위한 새로운 아이디어를 제공했습니다. 중국 베이징우전대학과 베이징대학이 공동 개발한 UniBind 프레임워크는 다중 스케일 그래프 신경망을 통해 단백질 상호작용을 분석하여 CTP에서 사이토카인과 미생물 대사산물 간의 동적 연관성을 연구하기 위한 계산 기반을 제공합니다.
논문 링크: https://www.nature.com/articles/s41591-023-02483-5
또한, 중국 상하이 기술 대학의 한 팀은 AI 알고리즘을 사용하여 CAR 분자의 전하 분포를 최적화하는 CAR-Toner 플랫폼을 개발하여 세포 확장 효율성을 개선하고 배치 차이를 줄이는 데 성공했습니다. 이러한 혁신은 생산 효율성을 향상시킬 뿐만 아니라, CTP의 표준화된 생산을 위한 새로운 기술 지원도 제공합니다.
논문 링크: https://www.nature.com/articles/s41422-024-00936-1
업계 역시 좋은 소식을 접했다. 중국 생명공학 기업 Fosun Kairui의 CAR-T 치료제 "Yikeda"는 2025년 중국 내에서 최초로 국경 간 공급을 달성했습니다. 그 이면에는 초저온 운송 중 세포 활동을 보장하는 AI 기반 콜드체인 물류 관리 시스템이 있습니다. 또한, 미국 생명공학 기업 A2 Bio는 보편적 공여 세포의 AI 스크리닝을 통해 CAR-T 약물의 대량 사전 생산을 달성하여 생산 비용을 크게 낮추고 치료 대기 기간을 단축하여 환자들에게 더 많은 희망을 가져다주었습니다.
해외 연구기관 역시 AI 기반 세포치료 분야에서 눈부신 성과를 거두었습니다. 2025년, 미국 듀크 대학의 생체공학 연구팀은 ESM-2 단백질 언어 모델을 기반으로 기능적 짧은 펩타이드를 설계하는 PepPrCLIP 기술을 개발하여 정밀 암 치료에 대한 새로운 전략을 제공했습니다. IBM 왓슨 헬스가 미국 스탠포드 대학과 협력해 구축한 AI 예측 모델은 환자 유전체, 프로테옴, 다차원 임상 데이터를 통합해 CAR-T 치료에서 사이토카인 방출 증후군(CRS) 예측 정확도를 89%까지 향상시켰으며, 고위험 환자의 임상 개입을 사전에 도울 수 있게 됐다. 이러한 것들은 글로벌 세포 치료 분야의 발전에 새로운 활력을 불어넣었습니다.
현재 AI4S는 CTP 분야에서 기초연구부터 임상응용까지 완전한 체인을 구축했으나, 데이터 표준화, 기관 간 협업 메커니즘 등 측면에서는 아직 개선이 필요합니다. 앞으로 정책 지원이 확대되고 산업, 학계, 연구가 긴밀히 통합됨에 따라 AI4S는 CTP 개인 맞춤형 준비, 실시간 품질 추적, 국경 간 물류 최적화와 같은 분야에서 더 큰 혁신을 이룰 것으로 기대됩니다.
참고문헌:
- https://mp.weixin.qq.com/s/VZI7pm-kO7CxNJyrn9-qQw
- https://mp.weixin.qq.com/s/0AoP5XSLOLzcTChQoIIfmw
- https://mp.weixin.qq.com/s/Avu5SbLetCFBVUwnDybfsw
- https://mp.weixin.qq.com/s/WoruStfCdYNDskAn_iFYtQ
- https://www.nsfc.gov.cn/publish/portal0/tab1128/info90687.htm