새 알고리즘 miniQuant, 유전자 이형체 정량화 난제 해결
과학자들은 새로운 알고리즘인 miniQuant을 제안하여 유전자 이형체 정량화 문제를 해결했습니다. 이 알고리즘은 시뮬레이션 데이터와 실제 데이터를 통해 뛰어난 성능을 보여주었습니다. miniQuant-H는 시뮬레이션 데이터에서 평균 절대 비율 차이(MARD)가 0.1249로, 기존의 짧은 콜드 시퀀싱 도구(0.1505-0.3555)와 긴 콜드 시퀀싱 도구(0.2515-0.9394)보다 우수한 결과를 나타냈습니다. 실제 데이터 검증에서는 LRGASP 컨소시엄에서 제공한 합성 표준 전사체를 사용했습니다. ERCC 표준 전사체의 경우, 유전자 구조가 단순해 해체 오차가 거의 없었지만, miniQuant-H는 표본 오차가 적기 때문에 짧은 콜드 도구와 유사한 정확도를 보였습니다. 복잡한 구조의 SIRV 표준 전사체에서는 miniQuant-H가 가장 낮은 평균 오차를 기록하며 긴 콜드 도구보다 우수한 성능을 보였습니다. 연구팀은 miniQuant을 인간 배아 줄기세포(ESC) 분화 연구에 적용하여, 배아 줄기세포가 인후내피(PE)와 원시 생식세포(PGC)로 분화되는 과정에서 발생하는 이형체 전환 모델을 성공적으로 파악했습니다. 이 연구에서 151개(ESC에서 PE)와 161개(ESC에서 PGC)의 이형체 전환이 구별되었습니다. 예를 들어, MAT2B 유전자는 전체 발현 수준이 안정적이었지만, 이형체 전환으로 인해 모델에서 명확한 변화가 관찰되었습니다. 이러한 전환은 세포의 번식 조절 능력에 영향을 미칠 수 있습니다. 특히, 고발현 유전자(82-99 백분위, TPM 30.60~1,077.09)에서 이형체 전환 모델의 탐지를 위해 긴 콜드 시퀀싱을 사용하는 경우, 표준적인 시퀀싱 깊이(예: 600만 cDNA-ONT 리드)에서 이 유전자의 발현 수준이 75백분위까지 감소하면, 긴 콜드 도구의 정량 결과가 표본 오차로 인해 신뢰할 수 없게 됩니다. 반면, miniQuant-H는 짧은 콜드 데이터를 통합하여 더 넓은 발현 범위에서 안정적으로 이형체 전환 모델을 탐지할 수 있습니다. miniQuant은 현재 RNA 시퀀싱 기술의 발전을 두 가지 방향으로 추진합니다. 첫째, 이형체 정량화의 신뢰성을 평가하기 위한 이론적 틀을 제공합니다. 둘째, 실제 데이터 특성과 유전자 구조를 자동으로 적응하여 최적의 전략을 선택할 수 있는 소프트웨어 도구를 제공합니다. 평가자들은 "이 연구는 처음으로 엄격한 과학적 방법을 통해 연구자들이 어떤 유전자가 복잡하고, 어떤 유전자가 단순하며, 언제 어떤 시퀀싱 기술을 선택해야 하는지를 알려줍니다. 이전에는 감각과 경험에 의존했지만, 이제 우리는 과학적인 기준을 제공합니다"라고 말했습니다. 또 다른 평가자는 "오랜 시간 동안 해결되지 않았던 주요 문제에 답을 제공했다"고 평가했습니다. 현재 miniQuant 소프트웨어는 GitHub 플랫폼(https://github.com/Augroup/miniQuant)에서 오픈소스로 공개되어 있으며, 다양한 시퀀싱 플랫폼과 깊이 조합에 대한 예측 모델을 제공하고 있습니다. 이 모델은 cDNA-PacBio, cDNA-ONT, dRNA-ONT 등을 포함합니다. 긴 콜드 시퀀싱 기술의 비용이 지속적으로 하락하고 정확성이 향상되면서, 이 알고리즘이 RNA-Seq 연구를 더욱 정밀하고 경제적으로 수행할 수 있는 방안을 제공할 것으로 기대됩니다. 유전자 이형체 기능 연구의 깊은 이해를 돕기 위한 중요한 도구가 될 것입니다.