2ヶ月前
言語モデルを用いた定量的推論問題の解決
Aitor Lewkowycz; Anders Andreassen; David Dohan; Ethan Dyer; Henryk Michalewski; Vinay Ramasesh; Ambrose Slone; Cem Anil; Imanol Schlag; Theo Gutman-Solo; Yuhuai Wu; Behnam Neyshabur; Guy Gur-Ari; Vedant Misra

要約
言語モデルは、自然言語理解を必要とする幅広いタスクで著しい性能を達成しています。しかし、最先端のモデルは、大学レベルの数学、科学、工学などの問題を解くために必要な定量的推論を要するタスクにおいて、一般的に苦戦してきました。このギャップを埋めるために、私たちはMinerva(ミネルヴァ)という大規模な言語モデルを導入します。このモデルは一般の自然言語データで事前学習され、さらに技術的なコンテンツで追加学習されています。外部ツールを使用せずに、技術的なベンチマークで最先端の性能を達成しています。また、物理、生物学、化学、経済学など、定量的推論が必要となる200以上の大学レベルの問題についても評価を行い、その結果、モデルがこれらのおよそ3分の1の問題を正しく解答できることが確認されました。