中国科学院、RNA 剪接調御予測モデルを開発
中国科学院北京基因组研究所のチームが、複雑な生理条件下における RNA 剪接と転写本使用パターンを高精度に予測する新モデル「HELIX」を開発しました。従来の研究では、RNA 結合タンパク質の発現や DNA 配列を統合した予測モデルの不足が課題でしたが、HELIX はこれらの要素を階層的な深層学習で処理し、特定の組織や細胞種における転写本レベルの剪接を正確に再現します。このモデルは、DNA 配列から剪接サイトの強度を予測し、さらに 1499 種類の RNA 結合タンパク質の発現データと組み合わせて、複数の剪接サイト間の依存関係を解析する仕組みを採用しています。評価結果では、HELIX は既存の主流手法を上回る精度を示し、特に高度に制御された部位や転写本比率の予測において優れた性能を発揮しました。実証研究では、大規模な結直癌データセットを用いて HELIX を適用したところ、腫瘍細胞における剪接の異常や転写本発現の変化が、ゲノム変異や RNA 結合タンパク質の異常、そして臨床的特徴と強く関連していることを特定しました。この知見は、がんの発生メカニズムの解明や患者の層別化に寄与する分子基盤を提供します。さらに、チームは single cell 対応の拡張モデル「scHELIX」も開発しました。これにより、腫瘍内の細胞間の多様性や異質性が明確に解析可能となり、異なる腫瘍サブクローン間の剪接パターンの差異が明らかになりました。これは、腫瘍の進化プロセスの理解や新たな治療標的の発見に向けた新たな視点をもたらします。本研究成果は組織特異的および疾病関連の剪接メカニズムに関する理解を深化させ、がんの分類、病変変異の解釈、そして精密医療の実現における方法論的基盤を確立しました。発表された論文は『自然-計算科学』に掲載され、国家自然科学基金委員会などの支援により実施されました。
