大多数现有的开源 LLM(例如 LLaMA-2)推理过程都比较复杂,在解决数学问题方面仍然不能令人满意。为了弥补这一差距,研究人员提出了 MetaMath,这是一种专门从事数学推理的微调语言模型。为了提升模型的正向和逆向推理能力,剑桥、港科大、华为的研究者基于两个常用的数学数据集(GSM8K 和 MATH)提出了 MetaMathQA 数据集:一个覆盖面广、质量高的数学推理数据集。 MetaMathQA 由 395K 个大语言模型生成的正向逆向数学问答对组成。他们在 MetaMathQA 数据集上基于 LLaMA-2 微调得到专注于数学推理(正向和逆向)的大语言模型 MetaMath,在数学推理数据集上达到了 SOTA 。 MetaMathQA 数据集和不同规模的 MetaMath 模型已开源供研究人员使用。
MetaMathQA 包含四种数据增强的方法:
做种 1
下载中 0
已完成 52
总下载 353