AIが植物DNAスイッチ解読、遺伝子制御を予測
ユーロッパの複数の研究機関が共同で開発した深層学習モデルにより、植物の遺伝子発現を制御するDNA上の転写因子結合部位が高精度に予測可能となった。この研究成果は近日中、学術誌Nature Communicationsに公表された。ジュリッヒ研究センターおよびライプニッツ植物学研究所IPKを中心とした国際チームは、モデル植物であるアラビドプシスの豊富なゲノムデータを用いて、46種類の転写因子ファミリーを同時に処理するマルチラベル型ニューラルネットワークを構築した。従来の単一因子別モデルとは異なり、DNA配列の文脈や隣接するシグナルの組み合わせを制御構文として捉えることで、個々の配列モチーフだけでは説明できなかった遺伝子制御の複雑なメカニズムを解明した。 同モデルはアラビドプシスの遺伝子を約14の主要な制御クラスターに分類し、共通の生物学的機能や協調発現パターンを明らかにした。さらに、開花時期や病害抵抗性、苗の成長など数千の形質と関連づけられた7,000種類以上のDNA変異のうち、約20%が転写因子の結合親和性の変化をもたらすことを特定した。この予測は実験的なアッセイによって実証され、単一塩基の変化が複数の転写因子の結合に同時に影響を与え、開花時期の前後を左右する分子メカニズムを具体的に可視化した。 注目すべきは、アラビドプシスのみで学習させながら、進化的に遠い作物であるトウモロコシにも高精度に転用できた点である。トウモロコシのゲノムデータに適用した結果、熱ストレス条件下で特に活性化する転写因子を正確に同定し、環境ストレスへの適応に関わる制御ネットワークの解明に貢献する見通しとなった。本研究は、従来統計的な相関関係にとどまっていた育種データを、分子レベルの機能的メカニズムへ橋渡しする手法を提供する。限られた実験データしか存在しない作物種においても、AIによる制御配列の高精度な注釈付けを可能にし、環境変化に対応できる次世代品種の開発を加速させる基盤技術として期待されている。
