2달 전
언어 모델을 사용한 양적 추론 문제 해결
Aitor Lewkowycz; Anders Andreassen; David Dohan; Ethan Dyer; Henryk Michalewski; Vinay Ramasesh; Ambrose Slone; Cem Anil; Imanol Schlag; Theo Gutman-Solo; Yuhuai Wu; Behnam Neyshabur; Guy Gur-Ari; Vedant Misra

초록
언어 모델은 자연어 이해가 필요한 다양한 작업에서 뛰어난 성능을 달성하였습니다. 그럼에도 불구하고, 최신 모델들은 대학 수준의 수학, 과학, 공학 문제를 해결하는 등 양적 추론이 필요한 작업에서는 일반적으로 어려움을 겪었습니다. 이러한 격차를 줄이기 위해, 우리는 일반 자연어 데이터로 사전 학습된 후 기술적 콘텐츠로 추가 학습된 대형 언어 모델인 미네르바(Minerva)를 소개합니다. 이 모델은 외부 도구를 사용하지 않고 기술적 벤치마크에서 최고 수준의 성능을 달성하였습니다. 또한, 물리학, 생물학, 화학, 경제학 등 양적 추론이 필요한 200여 개 이상의 대학교 수준 문제에 대해 우리의 모델을 평가한 결과, 이 모델이 거의 세 분의 일의 문제들을 올바르게 답할 수 있음을 확인하였습니다.