GeoGPT revolutioniert die Geowissenschaften durch KI-gestützte Forschungsrevoluzione
生成式人工智能正以前所未有的速度重塑科学研究范式,而GeoGPT的问世标志着地球科学领域迈入智能化新纪元。作为全球首个专为地学设计的领域基础模型,GeoGPT于2024年4月27日正式开源上线,由之江实验室牵头,联合浙江深时数字地球国际研究中心等25家国内外机构、400余名地学专家共同研发,旨在破解地球系统复杂性难题。该模型基于Llama3、Qwen2.5、DeepSeek R1、Mixtral及自研021科学基础模型等多架构支持,结合自主研发的GeoGPT-R1-Preview推理优化版本,具备文献解析、知识图谱构建、地质图识别、科研创意生成与多模态数据融合等核心能力。 面对地学领域长期存在的数据异构、长尾信息难整合、学科壁垒严重等问题,GeoGPT通过系统性创新实现“三维突破”:在数据层面,团队从Common Crawl中筛选出约1400亿token的公开论文数据,严格遵循CC BY/NC许可协议,覆盖28.8万篇OA论文与15家权威出版社资源,构建了高质量、可追溯的专业语料库;在知识体系层面,采用本体论驱动的知识图谱方法,实现跨学科概念统一与歧义消解,支持多语言、多术语表达的动态对齐;在技术架构上,创新提出“需求拆解-分层处理”框架,将复杂数据抽取任务分解为对象识别、属性提取与关系构建,使原本需一周完成的工作压缩至一天内高质量完成,效率提升超90%,同时推理成本降低80%。 GeoGPT已成功应用于岩浆岩数据库构建、古生物分类体系升级、地质图智能生成等多个关键场景。在与中国地质科学院王涛教授团队合作中,实现从科学假设提出到研究图件生成的全流程智能化,显著加速深部物质演化与大陆地壳生长研究。与美国普渡大学James Ogg教授团队合作,仅用4个月完成《无脊椎动物专著》3卷中数千化石属的数据结构化提取,时间成本下降75%,被誉为“将不可能变为现实”的典范。该成果入选国际电信联盟(ITU)2025年AI for Good全球峰会创新案例集,并获优秀实践奖,彰显其国际影响力。 目前,GeoGPT注册用户已超4万,覆盖135个国家,国际用户占比超25%。其开放性与可扩展性使其不仅适用于地学,还可推广至天文学、生态学等多学科领域。之江实验室科学数据枢纽研究中心副主任陈红阳指出:“GeoGPT不仅是工具,更是科研范式的变革者——它推动研究从实验驱动转向数据与模型双轮驱动,实现人机协同、跨域融合的智能科研新形态。” 业内专家普遍认为,GeoGPT的出现标志着地球科学正式进入“AI原生”时代。英国地质学家Mike Stephenson教授评价其“为其他科学领域树立了标杆”,是首个真正意义上融合领域知识、实现动态更新与可解释推理的科学基础模型。未来,随着物理规则嵌入、多源数据融合与自主科研Agent的发展,GeoGPT有望成为地球系统模拟的“智能引擎”,推动从观测到预测、从经验到原理的范式跃迁。