新アルゴリズム「miniQuant」、遺伝子異種体の定量問題を解決へ
新アルゴリズム miniQuant、遺伝子異形体の定量問題を解決 新アルゴリズム miniQuant が開発され、遺伝子異形体の定量という課題に画期的な解答が提案されました。このアルゴリズムのハイブリッド版である miniQuant-H は、既存の短读片段(短リード)と长读片段(長リード)の定量ツールを凌駕する優れた性能を示しています。シミュレーションデータでは、miniQuant-H の平均相対差(MARD)は 0.1249 で、既存の短リード(0.1505-0.3555)と長リード(0.2515-0.9394)ツールよりも精度が高いことが確認されています。 また、実データ検証では LRGASP コンソーシアムから提供された合成スパイクイン・リボノミクスデータセットが使用されました。単一異形体のスパイクイン・リボノミクス(ERCC)では、遺伝子構造が単純化されているため、解析誤差が少ないことがわかりました。ただし、長リードツールでは取 Samp 錯差により精度が低下することがありましたが、miniQuant-H は短リードツールと同等の精度を達成しました。複雑な遺伝子構造を持つ SIRV スパイクイン・リボノミクスでは、長リードツールが優れている一方、miniQuant-H も最低の平均誤差を示すなど、高精度かつ適応可能な性能を維持しています。 RNA定量研究への貢献 miniQuant は、胚性幹細胞(ESC)の分化研究においても活用され、分化過程での異形体変化モデルを正確に解明しました。具体例として、MAT2B 基因は全体の表現水準が安定しているにもかかわらず、その異形体を使用モデルにおいて顕著な変化を示しており、これが細胞の分裂調節能力に影響を与える可能性が指摘されています。 データ整合性の優位性 既存の統合手法と比較して、miniQuant は技術的な優位性を示しました。例えば、StringTieMix は短リード配列を最長リード支持する異形体に分配するシンプルなアプローチを採用していますが、その結果としてシミュレーションデータでの性能が限界に達しています。これに対し、miniQuant-H は複雑な機械学習モデルと結合相似関数を用いて、より正確で適応的なデータ整合を実現しています。 共同研究者健壯は次のように述べています。「この研究成果は、初めて厳密な科学的方法で研究者がどの基盤が複雑であるのか、どの基盤が単純であるのか、どのような測定技術を選択すべきなのかを告知するものです。これまでは感覚や経験に頼る判定が主流でしたが、我々は科学的な基準を提供しました」。另一位评审员也评价该研究“回答了一个长期未解决的问题”。 現在、miniQuant ソフトウェアは GitHub プラットフォーム(https://github.com/Augroup/miniQuant)でオープンソースとして公開され、cDNA-PacBio、cDNA-ONT、dRNA-ONT などの異なる測定プラットフォームおよび測定深度組合に対応する訓練モデルが提供されています。長読片段の測定成本の低下と精度の向上に伴い、この種の知能整合同測り具が転写組研究に更加精確和经济高效的解决方案提供し、基盤異形体機能性研究のさらなる発展が期待されます。