Google DeepMindが、初めてオンデマンドで生成される世界地図「AlphaEarth Foundations」をリリース

衛星技術の発展により、人類は地球をほぼリアルタイムで観測できるようになりました。しかし、膨大で多様なモーダル性を持ち、頻繁に更新されるリモートセンシングデータは情報量が豊富である一方で、データソースが分散し、フォーマットが異なり、利用方法が複雑であるという新たな課題ももたらしています。こうした分散した情報を、一貫性があり利用可能な地球の視点に統合することは、科学者や政策立案者にとって大きな課題となっています。Google DeepMindの最新リリースであるAlphaEarth Foundationsは、この課題に正式に対応しています。このモデルは「仮想衛星」と捉えることができます。PBレベルの地球観測データを統合し、この革新的な技術は、コンピューティングシステムで効率的に処理できるデジタル地球埋め込みを生成します。農業監視、環境保護、都市拡大、水資源管理といった重要な課題について、これまでにない地球規模の視点を提供します。
* 論文リンク:
非常にコンパクトなデータによりストレージスペースを削減
AlphaEarth Foundationsの核となるイノベーションはこれは、リモート センシング データの 2 つの主要な問題、つまり情報過多とデータの不整合を解決します。このモデルは、光学衛星画像、レーダーデータ、3Dレーザースキャン、気候シミュレーションなど、数十の公開データソースからの情報を集め、これらのマルチソースデータを統合・分析することで、10メートル×10メートル単位で全世界の陸地と沿岸地域を高精度にモデリングします。
このシステムの核となる革新性は、各マス目の非常にコンパクトな要約を生成する能力にあります。他の AI システムと比較して、必要なストレージ容量はわずか 1/16 で、惑星レベルの分析コストを大幅に削減します。
つまり、このモデルは初めて「オンデマンドの全球地図生成」を実現しました。研究者は特定の衛星が上空を通過するのを待ったり、雲量といった従来の困難に直面したりする必要はありません。AlphaEarth Foundationsの埋め込みベクトルを通して、鮮明で構造化された、一貫性のある地球地図を瞬時に取得できます。
あらゆる面で他のモデルよりも優れたパフォーマンスを発揮します
AlphaEarth Foundationsの動作原理は下図に示されています。このシステムは、ビデオシーケンスから不均一にサンプリングされたフレームを抽出することで、任意の時点をインデックス化します。これにより、モデルは大量の測定データを解釈しながら、その場所の連続的なビューを構築することができます。

AlphaEarth Foundationsの性能を検証するため、研究チームは厳密な比較テストを実施しました。実験の結果、土地利用の特定や地表属性の推定など、様々な期間やタスクにおいて、AlphaEarth Foundationsが優れたパフォーマンスを発揮することが示されました。特に、ラベル付きデータがない場合でも、AlphaEarth Foundationsは優れた学習効率を示しました。平均エラー率は他のモデルよりも 24% 低くなります。
この利点により、このシステムは科学研究や公共サービスにおいてかけがえのないツールとなっています。例えばエクアドルでは、このモデルは一年中雲に覆われた環境を透過し、様々な農地の生育段階を詳細に描写することができます。南極では、衛星画像の撮影頻度が極めて低い地域でも、このモデルは地表構造を確実に復元することができます。カナダでは、農地利用の違いを肉眼で確認できる以上の詳細さで描写することができます。

各埋め込みには64個の要素が含まれており、64次元球面上の座標に対応している。
現在利用可能な最大のAI地球埋め込みデータセットの1つ
Googleは、より広範な普及を促進するため、AlphaEarth FoundationsがGoogle Earth Engineプラットフォーム上で毎年生成する埋め込みベクトルのコレクションを「衛星埋め込みデータセット」として公開しました。このデータセットは、世界中で毎年1兆4000億点を超える埋め込みポイントをカバーしており、利用可能なAI地球埋め込みデータセットとしては最大級の1つとなっています。
過去1年間で、学術機関、政府機関、非営利団体など50以上の組織がこのデータセットを試験的に運用してきました。その代表例である地球生態系アトラスは、世界の生態系を体系的に分類する初のリソースの構築を目指しています。AlphaEarthのデータを用いることで、これまで分類されていなかった生態系地域を「沿岸低木地帯」や「超乾燥砂漠」といったカテゴリーに分類することに成功し、各国が保全・修復活動を最適化するための科学的根拠を提供しています。
ジェームズ・クック大学地球生態学研究所所長ニック・マレー氏は「このデータセットは、地図に載っていない生態系に対する理解に革命をもたらし、保護地域の優先順位付けに極めて重要だ」と語った。
ブラジルでは、環境団体MapBiomasがこのデータセットを活用し、特にアマゾンのような重要な生態系地域における農地利用と環境変化についてより深く調査しています。プロジェクトの創設者であるタッソ・アゼベド氏は、「このツールによって、マッピングの精度、速度、そして範囲が飛躍的に向上しました。これまで不可能だったことが可能になりました」と述べています。
将来的には、この技術は静的な地図だけでなく、リアルタイムの災害警報、気候変動シミュレーション、食料安全保障管理、その他の地球規模の問題解決にも活用される可能性があります。Googleはまた、モデルの最適化を継続し、データセットのサイズと適用範囲を拡大していくと述べています。