Command Palette

Search for a command to run...

香港科技大学のチームは、地球規模の水質健康診断のための時空間補間および予測モデルを提案し、沿岸地域に沿ったクロロフィル a の時空間分布を正確に予測できるようになりました。

Featured Image

陸地からの栄養分の流入と活発な流体力学により、沿岸水域は世界で最も生産性の高い海洋生態系の 1 つとなっていますが、深刻な富栄養化や低酸素症などの潜在的なリスクももたらします。クロロフィル a (Chl_a) の空間的・時間的分布を予測することは、沿岸生態系の健康状態を診断するための重要な手段です。

しかし、既存のツールは、クロロフィル a の空間的・時間的分布の予測に基づく分析アプローチをサポートするにはまだ不十分です。その中で、従来の流体力学と生物地球化学の結合法では、海洋生態系における栄養塩の移動を分析することが難しく、エネルギーフラックスやバイオマスなどの要素を計算に組み込むことが難しいという問題があり、データ駆動型の予測法では、非線形システムの長期統合プロセスにおいて誤差が蓄積されやすいという問題があります。

このような背景から、香港科技大学の研究チームは、沿岸海洋のクロロフィル a を予測するために人工知能駆動型の時空間補間および予測 (STIMP) モデルを開発しました。 STIMP モデルは、特別に設計されたモジュールを統合することで、不完全なデータ、一時的な非定常変化、空間的な異質性によって引き起こされる問題を解決し、時間的および空間的な制約の下で海洋クロロフィル a を予測するための新しいパラダイムを提供します。

関連する研究成果は、「時空間補完および予測モデル」というタイトルで Nature Communications に掲載されました。

研究のハイライト:

* STIMPモデルを開発し、2段階の「補間+予測」アーキテクチャを提案し、高い測定欠落率と時空間パターンの損失の問題を効果的に軽減し、予測の不確実性を定量化しました。

* 時空間ノイズ除去拡散モデル (STDDM)、時間線形変換器 (TLT)、異種空間グラフニューラルネットワーク (HSGNN) を統合し、不完全なデータ、非定常な時間的変化、空間的異質性という 3 つの主要な課題に対処します。

*実証的研究は、珠江河口、揚子江河口、メキシコ湾北部、チェサピーク湾の 4 つの代表的な地域で完了し、STIMP モデルのクロロフィル a の空間的・時間的分布を予測する能力の世界的な有効性を検証しました。

用紙のアドレス:

https://go.hyper.ai/BjOR5

公式アカウントをフォローし、「クロロフィル沿岸分布」と返信すると、完全なPDFが手に入ります。

MODISクロロフィルa測定データセット

本研究では、香港沖で測定されたクロロフィルaデータセットと、サンフラワー衛星のリモートセンシング反射率データセットを用いて、3つの異なる水深におけるクロロフィルa反転モデルを構築しました。本研究で使用されたMODISクロロフィルaデータは、中分解能撮像分光放射計(MODIS)Aquaプロジェクトを通じて公開されており、処理済みのMODISクロロフィルaデータはZenodoで入手可能です。

Zenodoウェブサイト:

https://doi.org/10.5281/zenodo.14638405

ディープラーニングに基づくSTIMP法

研究チームはディープラーニングベースの手法を使用して、沿岸海洋のクロロフィル a 観測データと観測データの地理座標を含む空間マップを STIMP アーキテクチャに入力し、完全なクロロフィル a データセットを取得して、沿岸海洋のクロロフィル a を正確に推定および予測しました。

世界の代表的な沿岸域におけるクロロフィルa観測情報

STIMPモデルの2段階アーキテクチャ

STIMP はクロロフィル a の予測を、補間と予測という 2 つの連続したステップに分解します。補間プロセスでは、研究では時空間埋め込みモジュールを使用して空間構造と時間的ダイナミクスを同時に捉え、部分的な観測から複数の潜在的な完全な時空間クロロフィル a 分布を再構築しました。予測ステップでは、STIMP は再構築されたクロロフィル a の時空間分布に基づいてルビンの規則を使用し、複数の補間および予測プロセスの結果を平均化して最終的なクロロフィル a 予測値を取得します。

STIMPモデルの2フェーズアーキテクチャの概要

STIMPモデルの3つのコア統合モジュール

衛星リモートセンシング観測の急速な発展は、データ駆動型の大規模時空間クロロフィルa予測手法の開発機会をもたらしています。しかし、データの不完全性、非定常な時間変動、空間的不均一性といった課題も生じています。これらの課題に対処するため、STIMPモデルは、時空間クロロフィルa予測を実現するための3つのコア統合モジュールを設計しました。

時空間ノイズ除去拡散モデル時空間ノイズ除去拡散モデル(STDDM):補間関数に適用されたSTDDMは、補間フェーズにおける高い欠損値の下で完全な時空間分布を再構築します。このモジュールは、複雑なタスクをより単純なタスクに分解し、信号対雑音比を徐々に改善することで、不完全な観測から完全なデータへの移行を実現します。

*  時間線形トランスフォーマーTemporal Linear Transformer (TLT): 非定常な時間変動パターンを捉えるために使用されます。自己注意メカニズムを用いて時系列全体の依存関係を計算し、クロロフィルaの動的な変化に関する重要な情報を保持します。その後、時系列のすべての要素を計算し、クロロフィルaの時間的パターンの理解を容易にします。

異種空間グラフニューラルネットワーク異種空間グラフ ニューラル ネットワーク (HSGNN): このアプローチは、空間の異質性に対処し、パラメーター プールを利用して場所固有のパラメーターを生成することで、さまざまな地理的環境における地域の違いに対する感度を確保します。

これら 3 つの統合モジュールにより、STIMP モデルは、不完全なデータ、複雑な時間的ダイナミクス、および大きな空間的差異に直面しても、補間および予測段階で堅牢な推定と予測を実現できます。

STIMPパフォーマンスの検証

STIMPの時空間補間性能

本研究では、珠江河口を例に、STIMPモデルの時空間補間の有効性を実証しました。研究者らは、2015年2月7日から2016年2月2日までの珠江河口全域の観測データを選択し、STIMPと、データ補間経験直交関数(DINEOF)、マスクオートエンコーダ(MaskedAE)、線形補間(Lin-ITP)などのベースライン手法を用いてクロロフィルaの分布を再構築しました。

実験では、珠江河口の平均欠落測定率が 50.29% に達したときに、STIMP モデルは 1 年間の補間タスクで DINEOF と比較して平均絶対誤差 (MAE) を 45.90% ~ 77.35% 削減し、2 番目に優れたモデルと比較しても 10.20% ~ 40.38% 削減することが示されています。 STIMPは、補間処理中に空間関係を効果的に維持し、海岸線付近ではより大きな値、ほとんどの地域では同様の値を生成します。欠損データ率が高い場合でも、STIMPは完全なデータを効果的に再構築できます。

珠江河口におけるクロロフィルaの分布の測定と推定

さらに、STIMPは補間時に時間的な関係を効果的に維持します。2015年2月7日から2022年9月22日までの5つの地点を補間する場合、STIMPは単純な線形補間よりも多くの変動を組み込みます。

STIMPによる5地点のクロロフィルa推定値

本研究では、世界中の沿岸海域におけるSTIMPの有効性も検証されました。揚子江河口では、STIMPのMAEはDINEOFと比較して68.31%減少して90.92%となり、次に優れたAI法と比較して15.62%減少して42.67%となりました。メキシコ湾北部では、STIMPのMAEはDINEOFと比較して69.42%減少して74.88%となり、チェサピーク湾では、STIMPのMAEはDINEOFと比較して62.08%減少して75.63%となりました。全体的に、STIMP はさまざまな欠損率条件下で安定したパフォーマンスを維持でき、高い欠損率でも真の時空間構造を再構築できます。

STIMPの時空間予測性能

研究者らは、予測実験を通じてSTIMPの優れた長期予測性能を検証しました。ベースライン手法と比較すると、STIMPの平均絶対誤差(MAE)は、1年間の予測では6.54%減少して13.68%となり、2年間の予測では13.68%減少して32.25%となり、3年間の予測では13.77%減少して32.01%となり、他の予測手法を上回りました。

1年、2年、3年の予測におけるSTIMPとベースラインモデルのMAEパフォーマンス

また、データを入力すると、STIMP の分布予測が大幅に改善されます。欠損データの割合が高い領域では、STIMP の予測結果が PredRNN よりも改善される傾向があり、これは予測前にデータを入力することで STIMP がクロロフィル a の空間分布と季節シグナルを効果的に捉えられることを証明しています。

実際の値とPredRNNのMAE、補間なしのSTIMP、およびSTIMP予測値
補間によるパフォーマンス向上と欠損データ率の関係

珠江河口を例に挙げると、STIMPは数値モデルCMOMSおよびディープラーニング手法PredRNNと比較して、予測MAEを大幅に向上させます。1年間の予測ではMAEが6.54%削減されて13.68%となり、2年間の予測では13.68%削減され、3年間の予測では13.77%削減されて32.01%となります。個々の地点では、STIMPはCMOMSと比較してMAEが74.63%から最大53.78%、PredRNNと比較してMAEが30.28%から最大1.83%向上します。

揚子江河口、メキシコ湾北部、チェサピーク湾では、STIMP の全体的な予測性能も PredRNN 方式に比べて大幅に向上し、データの周期性をより適切に維持できるようになりました。全体として、STIMP は、不完全な時空間観測データを処理する 2 段階アーキテクチャの有効性と堅牢性を実証しています。

「AI+海洋」の学際的研究とチーム

香港科技大学のヤン・カン氏とガン・ジャンピン氏が率いるチームの研究対象は、数学、統計学、人工知能、海洋物理学など多岐にわたります。

中でも、香港科技大学数学教授であり、ビッグデータ・バイオインテリジェンス研究所副所長を務める楊燕氏は、統計学習と人工知能(AI)手法における革新的な研究に尽力しており、深層学習、生成モデル、グラフニューラルネットワークといった最先端手法を高次元複雑データのモデリングと予測に応用することに重点を置いています。近年は海洋科学や公衆衛生にも研究領域を広げ、「AI + 海洋」における学際研究を積極的に推進しています。楊氏のチームはこれまで、BOOST/GBOOST加速GWAS解析ツールの開発、LEPのマルチ表現型リスク予測手法の提案、非欧米集団の遺伝子データから顔の特徴への変換を容易にするVGrow生成フレームワークの設計などを行ってきました。

香港科技大学海洋科学科主任教授の甘建平氏は、長年にわたり沿岸・棚海の循環ダイナミクスと生態系との結合過程の研究に尽力し、沿岸生態系の健全性、汚染制御、地域気候の持続可能な開発といった研究分野に重点を置いています。物理海洋学の分野では、甘建平氏のチームはWavyOcean 2.0地域海洋デジタルツインプラットフォームを開発しました。このプラットフォームは、海洋プロセスシミュレーション、GIS、BIM、デジタルツイン技術を統合し、海洋・陸・大気システムの3次元結合モデリングを実現し、粤港澳大湾区と中国沿岸を網羅する海洋流動、生物地球化学的進化、降水量、汚染拡散の動的可視化とインタラクティブ分析をサポートしています。現地観測とモデルシミュレーションを通じて、チームは南シナ海地域が二層交互循環循環構造を持つことを初めて明らかにし、従来の海洋モデルの構造的偏差を修正しました。

参考文献:

1.https://pubs.acs.org/doi/10.1021/cr300014x

2023年から2024年にかけてのAI4S分野の高品質な論文と詳細な解釈記事をワンクリックで入手⬇️