HyperAI超神経
Back to Headlines

GeoGPT開源:地学研究のAI革命、データ駆動型范式へ転換

3日前

生成式AIが地球科学の研究手法を根本から変える可能性を秘めた「GeoGPT」が、世界的な注目を集めている。このモデルは、之江实验室が主導し、国内外25機関・400人以上の地学専門家が共同開発した、地球科学に特化した領域基礎モデルで、2025年4月に正式にオープンソース化された。GeoGPTは、深時デジタル地球(DDE)国際大科学計画の理念を反映し、科学文献の解析・データ抽出、知識グラフ構築、地質図の認識と質疑応答、研究アイデアの生成といった機能を備え、岩漿岩・古生物データベース構築や地質図の自動生成など、実際の研究現場で活用されている。 特に注目すべきは、GeoGPTが単なる補助ツールにとどまらず、地学研究の「データ駆動型・計算密集型」への転換を推進している点だ。従来の観察や実験中心の研究から、AIと大規模データを活用した新しい研究パラダイムへと進化している。現在、GeoGPTの登録ユーザーは4万人を超え、135カ国に及ぶ国際的な利用が進んでおり、そのうち25%以上が海外ユーザー。さらに、2025年2月のスイス・ジュネーブ開催の「AI for Good」グローバルサミットで、国際電気通信連合(ITU)の『AI for Good 创新実践事例集』に選定され、優秀実践賞を受賞した。 GeoGPTは、Llama3、Qwen2.5、Mixtral、DeepSeek R1、および之江実験室独自の021科学基礎モデルなど、複数のオープンソース基盤モデルを柔軟に選択可能。また、推論効率を高めた専用モデル「GeoGPT-R1-Preview」も開発し、実装性を強化。研究チームは、CC BYやCC BY-NCライセンスの公開論文約28.8万編を厳選し、1400億トークン規模の高品質専門語彙データを構築。このデータは、FinewebやDCLMなど主流データセットを上回る専門性と信頼性を持つ。 技術面では、動的テーブル解析や自适应スライス戦略により、文献の構造化解析精度を大幅に向上。また、「要件分解-階層処理」フレームワークにより、複雑なデータ抽出タスクを1日以内に完了。従来1週間かかっていた作業が、わずか数時間で実現。さらに、地学専門家の問題解決プロセスを指令微調整と強化学習でモデルに組み込み、専門的推論能力を獲得。岩漿岩の物源進化や古生物分類といった複雑な研究課題において、研究効率を飛躍的に向上させている。 特に注目されたのは、米国プルーデンス大学のJames Ogg教授チームとの共同プロジェクト。『無脊椎動物専著』(Treatise on Invertebrate Paleontology)という50巻に及ぶ膨大な化石データを、AIによるバッチ抽出と専門家検証を組み合わせ、4カ月で3巻分を高精度にデジタル化。時間コストは75%削減。Ogg教授は「GeoGPTが『不可能』だったデータ化を実現した」と評価している。 之江実験室科学データハブセンターの陳紅陽副主任は、「GeoGPTは技術の融合だけでなく、地学とAIの専門家が一体となって問題を共有する『協働の仕組み』の構築を促進している」と指摘。今後は、研究の全プロセスをAIが統合し、仮説生成から報告書作成まで自動化する「AI主導の研究ワークフロー」の実現を目指す。GeoGPTは、地球科学の未来を切り拓く、画期的な知的基盤として、世界の研究者たちの期待を背負っている。

Related Links