HyperAI超神经
Back to Headlines

IBM 和 ESA 开源 TerraMind:最佳地球观测 AI 模型,显著提升水资源短缺预测精度

23 days ago

IBM与欧洲航天局(ESA)近日共同发布了名为TerraMind的开源地球观测模型,该模型旨在通过综合多种数据源提升地球观测的准确性和效率。作为今年由ESA主导的一项改进地球观测社区基础模型访问计划的一部分,这一合作项目汇集了IBM、KP Labs、尤里希超级计算中心(JSC)以及德国航空航天中心(DLR)的研究力量。项目的目标是构建一个能够真正理解地球的AI模型,从而更好地服务于科学研究和商业应用。 TerraMind采用了独特的基于对称变压器的编码器-解码器架构,适用于像素、令牌和序列等多种输入类型,并能学习不同模态之间的关联。尽管训练数据量达到了500亿个令牌,TerraMind仍是一个轻量级模型,所需计算资源仅为单一模态标准模型的十分之一,这不仅降低了部署成本,还减少了推理时的能源消耗。据称,TerraMind在土地覆盖分类、变化检测、环境监测以及多传感器和多时序分析等多个实际任务中表现优异。 在ESA的评估中,TerraMind与其他12款流行的基础模型进行了对比测试,结果显示其性能提高了8%以上。这一提高主要得益于TerraMind能够整合来自九种不同数据模态的数百万个数据点,包括卫星传感器数据、地表地貌、地表特征、植被和土地利用情况等,从而更全面地理解地球状况。例如,在预测水资源短缺风险时,TerraMind可以综合考虑土地利用、气候、植被、农业活动和地理位置等多重因素,提供更准确的风险评估。 从技术层面来看,TerraMind还引入了一项名为“Thinking-in-Modalities”(TiM)调优的新技术,这是首个“任意到任意”多模态生成AI模型。TiM调优允许模型自动生成其他模态的数据,从而提高特定应用场景下的数据使用效率。例如,在绘制水域图时,TiM可以指导模型“思考”土地覆盖情况,进一步提升模型的精度。 TerraMind不仅在技术上实现了突破,还弥补了现有地球观测模型的不足。目前,多数模型依赖于卫星提供的每五天更新一次的时间序列数据,这对于长期气候事件的分析较为充分,但在处理短期突发事件如森林火灾和洪水时,实时数据显得尤为重要。因此,IBM研究人员结合自身在数据准备和基础模型构建方面的专长,与ESA的高质量地球观测数据及模型评估经验相融合,共同开发出了这一新的多模态AI基础模型。 为了确保模型的适用性和准确性,TerraMind的数据集覆盖了所有生物群落、土地利用和土地覆盖类型,以及各个地区,包含了超过900万个全球分布且时空对齐的数据样本。该项目的持续推进还得到了NASA专家的支持,他们在NASA的开放式科学计划中对TerraMind进行了验证。 未来,针对灾害响应和其他高影响力的使用场景,TerraMind将进一步优化并添加至IBM Granite Geospatial仓库,以便更多的社区和企业能够利用这一先进的地球观测分析技术。业内人士认为,TerraMind的发布标志着地球观测领域的重大进展,为科研人员和决策者提供了更强大的工具支持。 IBM在地球观测领域有着深厚的技术积累,此次与ESA的合作再次体现了其在AI技术应用和创新方面的领导地位。NASA也积极参与了该项目,显示了国际科技合作对于解决全球性问题的重要性。

Related Links