2ヶ月前

F5C-finder: mRNA 上の 5-ホルミルシトジン修飾を予測する説明可能でアンサンブル型の生物学的言語モデル

Guohao Wang; Ting Liu; Hongqiang Lyu; Ze Liu
F5C-finder: mRNA 上の 5-ホルミルシトジン修飾を予測する説明可能でアンサンブル型の生物学的言語モデル
要約

5-ホルミルシトジン(f5C)は、一般的で動的に調節されるエピジェネティック修飾であり、様々な生物学的プロセスにおいて重要な役割を果たしています。しかし、従来のf5C検出実験手法はしばしば労力がかかるかつ時間のかかるものであるため、転写体全体でのf5Cサイトの包括的なマッピングに制限があります。計算機的手法はコスト効率が高く、大量処理が可能な代替手段を提供しますが、これまでf5Cの認識モデルは開発されていませんでした。本研究では、自然言語処理における言語モデルから着想を得て、多頭注意機構(multi-head attention)を利用したf5C-finderというアンサンブルニューラルネットワークベースのモデルを提案します。5つの異なる特徴抽出方法を使用して5つの個別の人工ニューラルネットワークを構築し、これらのネットワークをアンサンブル学習を通じて統合してf5C-finderを作成しました。10分割交差検証と独立テストにより、f5C-finderはAUC値がそれぞれ0.807および0.827で最先端(SOTA)の性能を達成することが示されました。この結果は、生物言語モデルがゲノム内の順序(sequential)と機能的意味(semantics)の両方を捉える有効性を強調しています。さらに、組み込まれた解釈可能性により、モデルが何を学習しているかを理解でき、重要な順序要素の特定とそれらの生物学的機能へのより深い探求との橋渡しを行います。

F5C-finder: mRNA 上の 5-ホルミルシトジン修飾を予測する説明可能でアンサンブル型の生物学的言語モデル | 最新論文 | HyperAI超神経