2 个月前
利用语言模型解决定量推理问题
Aitor Lewkowycz; Anders Andreassen; David Dohan; Ethan Dyer; Henryk Michalewski; Vinay Ramasesh; Ambrose Slone; Cem Anil; Imanol Schlag; Theo Gutman-Solo; Yuhuai Wu; Behnam Neyshabur; Guy Gur-Ari; Vedant Misra

摘要
语言模型在需要自然语言理解的各种任务中已经取得了显著的性能表现。然而,最先进的模型通常在需要定量推理的任务上表现不佳,例如解决大学水平的数学、科学和工程问题。为了缩小这一差距,我们引入了Minerva(弥涅尔瓦),这是一种大型语言模型,首先在通用自然语言数据上进行了预训练,然后进一步在技术内容上进行了训练。该模型在技术基准测试中实现了最先进水平的表现,而无需使用外部工具。我们还对我们的模型进行了评估,涉及物理、生物、化学、经济学及其他科学领域的两百多道本科生水平的问题,发现该模型能够正确回答其中近三分之一的问题。