HyperAIHyperAI

Command Palette

Search for a command to run...

科学者たちは、220種の海洋細菌に基づいて、ゲノム規模のモデルを用いて従属栄養微生物の分類体系を再構築し、8種類の代謝フローラを特定した。

Featured Image

森林は地球の肺、海洋は地球の心臓と称される。広大な海洋には数万もの微生物が生息し、複雑な群集を形成している。これらの微生物は独自の代謝特性によって有機物の変換を制御し、炭素の固定と放出のプロセスを促進することで、地球規模の炭素循環、気候変動、海洋生物多様性に大きな影響を与えている。中でも海洋従属栄養微生物は、海洋生態系における「浄化ユニット」として機能し、有機物分解という中核的な役割を担うことで、地球規模の物質循環と生態系のバランスを維持している。

海洋従属栄養微生物は、長らく古典的に、栄養豊富な微生物と栄養の乏しい微生物の2つの主要なカテゴリーに分類されてきた。前者は有機物含有量の多い環境で繁栄し、後者は資源の乏しい環境でゆっくりと生存する。長年使用されてきたこの伝統的な「二分法」は、生物地球化学研究にある程度役立ってきたが、重大な欠点もある。成長速度は基質利用の好みや代謝ニッチと同一視できないのだ。人間の食習慣を摂取量だけで分類できないのと同様に、「何を食べるのが好きか」が有機物分解速度を決定し、炭素循環の方向を調節する重要な要素となる。

この課題に対処するため、南カリフォルニア大学が率いるチームは、海洋微生物データベース(OMD)を活用し、ゲノムスケール代謝モデル(GEM)を用いて膨大な量の海洋細菌ゲノムを解析した。そして、11種類の有機基質の利用に対する微生物の感受性を定量化することで、従来の「二分法」の枠組みを打ち破ることに成功した。分化した代謝微生物叢の8つのカテゴリーが特定された。すなわち、急速に増殖する富栄養性微生物叢の1つのカテゴリー、基質特異的なゆっくりと増殖する貧栄養性微生物叢の3つのカテゴリー、および基質に特化した中間増殖性微生物叢の4つのカテゴリーである。

「海洋微生物従属栄養生物の代謝ニッチの定義」と題されたこの研究結果は、科学誌『サイエンス・アドバンシズ』に掲載された。

研究のハイライト:

* 従来の「二分法」の枠組みから脱却し、実際の代謝戦略と基質嗜好に基づいて、微生物特有の代謝ニッチを確立する。 

* この研究は、8つの機能的な微生物群集に基づいて、海洋従属栄養微生物の増殖パターン、資源競争モデル、および世界的な地理的分布を体系的に明らかにし、微生物が海洋炭素循環を駆動する固有のメカニズムを解明します。

* 海洋従属栄養微生物の地球規模の炭素循環への関与に関する研究のギャップを埋め、生物地球化学モデルのための洗練された改善案とパラメータ設定案を提供する。

用紙のアドレス:
https://www.science.org/doi/10.1126/sciadv.adz0537

データセット:220種類の海洋細菌を網羅

本研究は、microbiomics.ioプラットフォーム上でホストされているOMDデータベースから取得した、大規模な海洋微生物ゲノムデータセットに基づいています。このデータベースには、約35,000個の微生物ゲノムが収録されている。これには、メタゲノム解析によって構築されたゲノム、単一細胞増幅ゲノム、および人工的に分離・培養された株のゲノムが含まれる。

本研究では、完全性が80%以上、汚染率が5%未満の細菌ゲノムのみを対象とした。これらの値は、それぞれCheckMおよびAnvi'oソフトウェアの平均スコアを用いて算出された。その後、研究者らはOMDデータベースのメタデータを使用し、dRepソフトウェアを用いて、平均ヌクレオチド同一性(ANI)閾値95%でゲノムから冗長性を除去された。

多様なデータセット

180個の光合成独立栄養シアノバクテリア(外群)を除去した後、最終的に、重複を除去した後、3,738個の高品質な従属栄養細菌ゲノムが得られた。これは本研究の基本的な分析データセットを構成する。このデータセットは220種類の海洋細菌を網羅しており、そのうち14のグループには50個以上のゲノムが含まれている。

系統樹の構築にあたっては、180個のシアノバクテリアゲノムをアウトグループとして保持することに加え、BiGGデータベースから66個の細菌参照ゲノムを追加し、ゲノムの総数を3,984個とした。標的となる単一コピー遺伝子のマッチングが不十分であったため、8個のゲノムを系統樹から除外した。最終的に、3,976本の植物が育成樹の構築に使用された。全ゲノム分類情報は、GTDB-Tk v2.1.0およびGTDB r214データベースを使用して系統樹上にラベル付けされた。

自己組織化マップニューラルネットワークは、代謝ニッチの分類に用いられる。

従来の「二分法」の枠組みの限界を打破するために、本研究は、ゲノミクス、制約付き代謝シミュレーション、および教師なし機械学習技術を統合し、遺伝情報から微生物の生態型分類に至るまでの包括的な分析フレームワークを構築する。代謝モデリング、基質感受性の定量化、および微生物群集のクラスタリングは、複数の種類の現場測定値とグローバルな環境データセットを使用して階層的に実施された。

モデリングと品質管理

モデル構築段階において、研究者らは統合的なモデリング戦略を採用した。CarveMe v1.5.1ソフトウェアを用いて、3738株の海洋従属栄養細菌株それぞれについて、60個の独立した代謝モデル(モデルセット)を構築した。

具体的には、CarveMeソフトウェアのモデリング原理は、一般的な代謝モデルアーキテクチャに基づいています。入力されたゲノム注釈情報における各生化学反応の有無に基づいて、各反応ステップに重みを割り当て、それによって一般的なモデルを初期化し、対応するゲノムの代謝モデルを予測します。本研究では、単一ゲノムの反応プロファイルを網羅するために必要なモデルの繰り返し回数を包括的に調査しました。その結果、アンサンブル内のモデル数が約60に達すると、新たに追加される反応の総数が比較的安定することが示されました。これは、60個のモデルのセットで、単一のゲノムにおける実現可能な代謝モデルの組み合わせの大部分を網羅できることを示している。

CarveMeの出力代謝モデルの品質を定量化するために、本研究では評価指標として一貫性スコア指数Cを初めて導入しました。その式は以下のとおりです。

この式において、XmrはM個の独立して構築されたモデルにおけるアンサンブルモデル応答の「存在-欠落行列」を表し、rは単一の生化学的応答を指し、Rはモデルセット全体の応答の総数であり、Iは応答rがm番目のアンサンブルサブモデルに存在するかどうかを判断するために使用される指標関数である。その後の解析では、一貫性スコアが0.8以上のゲノムサンプルのみが保持され、合計1,578個のゲノムが対象となった。

代謝戦略評価

研究者たちは代謝戦略を、生物の成長にとって好ましい基質のセットと定義しており、彼らの方法論は、一連の感度分析を通してこれらの戦略を解釈することである。

具体的には、研究者らは、COBRApy v0.25.0ソフトウェアパッケージに含まれるフラックスバランス解析(FBA)ツールキットを用いて、CarveMeモデルについて、「基質が十分な」条件と「基質が制限された」条件の両方で成長感受性試験を実施した。 「基質制限」条件は、特定の種類の化合物の利用可能な流量を、「基質充足」条件下で生物が取り込む量の50%に減らすことによって設定される。

異なるモデル間における基質要求量の違いを定量化するために、以下に示す感度係数指標Sが提案されている。

この式において、μnはn型基質の制限条件下での予測成長率、μは基質が豊富にある条件下での予測成長率、fは基質制限係数(本研究では0.5とする)を表す。感度係数Sは[0,1]の範囲であり、基質供給量が50%減少した後にモデルによって計算された成長率が50%減少する場合、このタイプの基質は生物の成長に対する完全な制限因子であると判断される(成長感度は1)。モデルの成長率が変化しない場合、生物の成長はこのタイプの基質の供給によって影響を受けないことを意味する(成長感度は0)。

さらに、基質制限の程度と成長速度の低下の程度の比が0.8以上(S ≥ 0.8)の場合、そのモデルはそのような基質に対して有意な成長感受性を持つとみなされる。

教師なし機械学習におけるクラスタリング分析

本研究の機械学習部分では、代謝ニッチを明確にするために自己組織化マップ(SOM)が用いられた。 SOM(自己組織化マップ)は、教師なし機械学習アルゴリズムであり、膨大な高次元データセットの次元を、トポロジー構造を持つ2次元グリッド空間に削減することができる。

クラスタリングを行う前に、研究者らは上記で得られた1,578個のゲノムに対してデータスクリーニングを行い、60個のサブモデルすべてにおいて様々な代謝物の増殖感受性の分散をカウントした。基質感受性の分散の合計が0.1を超える100個のゲノムを除去し、1,478個のゲノムを残した。合計88,680セットの有効なデータ(1,478個のゲノム×60個のアンサンブルモデル)がSOMクラスタリング分析に使用された。各データポイントには11個の代謝感受性特性指標が含まれていた。

具体的な設定としては、本研究では標準化された複合フラックス予測データの処理にKohonen v3.0.12ソフトウェアを使用しました。20×20のトーラス状六角形グリッド(空間距離の表現には標準ユークリッド距離を使用)上で1,500回の反復計算を行いました。学習率パラメータは(0.025, 0.01)に設定し、近傍半径はソフトウェアのデフォルト値から選択しました。

十分なトレーニングの後、成長化合物の感受性予測結果の一貫性に基づいて、K平均クラスタリングアルゴリズムが採用される。SOMマップは最終的に8つの差分クラスターに分割された。

クラスタリング後、最大成長速度の違いを評価するために、本研究では、gRodonを使用して1478個の全ゲノムのdCUBを計算し、成長速度の速いタイプと遅いタイプに分類した。Tara Oceans、BioGeoTraces、Malaspinaなどの複数のデータセットからの1209個のメタゲノミクス、およびMcNicholらによるGlobal ASV Datasetに基づいて、8つの細菌群集の世界的な地理的分布が検証された。

基質選択性と増殖速度に基づいて、8つの代謝クラスターが分類された。

本研究では、モデルの性能を検証するだけでなく、より重要なことに、従来の「二分法」の枠組みを打ち破り、全く新しい分類ロジックを提案し、基質嗜好と代謝ニッチの間の本質的な関係を構築する、多様な実験結果を提示する。

モデル検証結果

研究者らは、186種類の海洋微生物の炭素源嗜好性に関する大規模培養実験において、CarveMeモデルが基質嗜好性を捉える能力の精度を検証した。具体的には、Gralkaらが研究したゲノムに対してCarveMeモデルを構築し、FBAを用いて対応するインシリコ実験を実施し、同じ炭素源条件下でのこれらの微生物の増殖を検証した。

結果は次のようになります。文献中の実験データと比較すると、モデル予測結果は75.51 TP3Tと87.41 TP3Tの精度を達成した。この結果がランダム予測よりも有意に優れているかどうかを評価するため、研究者らはランダム予測に対してブートストラップ分析を実施して検証したところ、モデルの精度はランダム予測よりも有意に高いことが示された。

8種類の細菌の型別結果

1,478のゲノム配列と11の感度指標に基づいて、本研究では、SOMクラスタリングによって発現が異なる8つの代謝微生物群を特定し、それらの増殖速度に基づいて、速い、中程度、遅いという3つの主要グループに分類した。具体的には(下の画像に示すように):


8つのSOMクラスターの平均成長感度の比較

カテゴリー 1: 急速に増殖する富栄養性微生物叢 (クラスター 6): これは典型的な富栄養性微生物叢であり、79.5% ゲノムは、低速増殖閾値 (dCUB < -0.08 が高速増殖閾値であり、dCUB 値が小さいほど増殖が速いことを示す) よりも高い最大ゲノム増殖速度を予測します。分類学的観点から、クラスター 6 の典型的な代表種には、腸内細菌目、フラボバクテリア目、ロドバクター目、シュードモナス目が含まれます。このタイプの微生物叢は基質の影響を最も受けにくく、試験した 11 種類の化合物のいずれかが欠如しても増殖は阻害されませんでした。

基質特異的で増殖速度が遅く、貧栄養性の細菌群が 3 つ (クラスター 1、クラスター 5、およびクラスター 8) あり、これらの群の dCUB は -0.111 です。その中で、クラスター 5 (61.81 TP3T) は最大増殖速度が最も低く、代表的な細菌は Opitutales (Verrucomicrobiota) と Pelagibacterales であり、この群におけるこれらの細菌の濃縮度はそれぞれ 4351 TP3T と 3621 TP3T に達します。

基質特異的な中間増殖性細菌群4つ(クラスター2、3、4、7):これらの群は、クラスター6よりも有意に低い増殖速度を示すが、クラスター5よりも有意に高い増殖速度を示すと予測された。クラスター3は、クラスター1および8よりも有意に高い増殖速度を示した。これら4つの中間増殖性細菌群はそれぞれ、アミノ酸、カルボン酸、炭水化物、ビタミンB群のうち1種類の化合物のみに対して増殖応答感受性を示した。

さらに、中程度の成長速度を示す微生物群集の特徴は、海洋表層下環境における主要な従属栄養性微生物群が、成長速度の遅い富栄養性細菌である可能性を示唆する最近の研究結果を裏付けるものでもある。この発見は、これらの微生物を代謝機能グループに分類するための基礎となり得る。例えば、クラスター4は炭水化物を好むといった特徴が挙げられる。

最後に書きます

要約すると、本研究は数十年来の富栄養性/貧栄養性ニッチという「二分法」の枠組みから脱却し、遺伝子と基質利用の本質に基づいた8つのカテゴリーからなる代謝ニッチ分類システムを確立することで、5つのカテゴリーと生理機能との間の固有の結びつきを打破するものである。

さらに、この新しい分類フレームワークは、海洋に生息する膨大な数の従属栄養微生物の複雑な構造を簡素化します。将来的には、これを地球規模の生物地球化学モデルに組み込むことで、数万種類もの海洋細菌を個別に記録する必要がなくなります。わずか8つの機能パラメータに基づいて海洋有機物の分解と炭素収支の変化を推定できるため、地球温暖化を背景とした海洋炭素循環の進化を評価するための全く新しい理論的ツールとなります。