Command Palette
Search for a command to run...
Andreas L. Gimpel Bowen Fan Dexiong Chen Laetitia O. D. Wölfle et al

초록
다중 템플릿 폴리머라제 연쇄 반응(PCR)은 다양한 DNA 분자를 병렬로 증폭할 수 있게 해주는 핵심 기술로, 양적 분자생물학에서부터 DNA 데이터 저장에 이르기까지 다양한 분야에서 응용되고 있다. 그러나 서열 특이적 증폭 효율의 차이로 인해 비균일한 증폭이 발생함에 따라, 증폭된 DNA의 상대적 농도 데이터가 왜곡되며 이는 정확도와 감도를 저하시킨다. 본 연구에서는 복잡한 암플리콘 라이브러리에서의 증폭 효율 문제를 해결하기 위해, 단일차원 컨볼루셔널 신경망(1D-CNN)을 활용하여 서열 정보만을 기반으로 서열 특이적 증폭 효율을 예측하는 방법을 제안한다. 합성 DNA 풀에서 얻은 신뢰할 수 있는 레이블링된 데이터셋을 기반으로 학습된 이 모델은 높은 예측 성능을 보이며(AUROC: 0.88, AUPRC: 0.44), 본질적으로 균일한 암플리콘 라이브러리 설계를 가능하게 한다. 또한, 우리는 CluMo라는 딥러닝 해석 프레임워크를 도입하여, 어댑터 프라이밍 부위 근처에 존재하는 특정 서열 모티프가 낮은 증폭 효율과 밀접하게 관련되어 있음을 규명하였다. 이러한 통찰은 증폭 효율 저하의 주요 원인으로 어댑터 매개 자가 프라이밍( adapter-mediated self-priming) 메커니즘이 존재함을 밝혀내며, 오랫동안 유지되어온 PCR 설계에 대한 기존 가정을 재고하게 한다. 본 연구에서 제시한 딥러닝 기반 접근법은 다중 템플릿 PCR에서 비균일한 증폭의 근본 원인을 해결함으로써, 99%의 암플리콘 서열을 회복하기 위한 시퀀싱 깊이를 4배 감소시켰으며, 유전체학, 진단학, 합성생물학 등 다양한 분야에서 DNA 증폭 효율 향상의 새로운 길을 열었다.