
摘要
解决人工智能(AI)在自动几何数学问题求解方面的挑战需要理解和处理多模态信息及数学知识。当前的方法在准确解读几何图形方面存在困难,这阻碍了有效的问题求解。为了解决这一问题,我们提出了带有自然语言描述的几何问题求解模型(Geometry problem sOlver with natural Language Description, GOLD)。GOLD通过分别处理图中的符号和几何基本元素,增强了对几何关系的提取能力。随后,该模型将提取到的关系转换为自然语言描述,高效利用大型语言模型来解决几何数学问题。实验结果表明,GOLD模型在UniGeo数据集的计算和证明子集上分别实现了12.7%和42.1%的准确率提升,优于之前的最佳方法——Geoformer模型。此外,GOLD模型还在PGPS9K和Geometry3K数据集上超越了前一最佳模型PGPSNet,分别获得了1.8%和3.2%的准确率提升。