2달 전

언어 모델을 사용한 양적 추론 문제 해결

Aitor Lewkowycz; Anders Andreassen; David Dohan; Ethan Dyer; Henryk Michalewski; Vinay Ramasesh; Ambrose Slone; Cem Anil; Imanol Schlag; Theo Gutman-Solo; Yuhuai Wu; Behnam Neyshabur; Guy Gur-Ari; Vedant Misra
언어 모델을 사용한 양적 추론 문제 해결
초록

언어 모델은 자연어 이해가 필요한 다양한 작업에서 뛰어난 성능을 달성하였습니다. 그럼에도 불구하고, 최신 모델들은 대학 수준의 수학, 과학, 공학 문제를 해결하는 등 양적 추론이 필요한 작업에서는 일반적으로 어려움을 겪었습니다. 이러한 격차를 줄이기 위해, 우리는 일반 자연어 데이터로 사전 학습된 후 기술적 콘텐츠로 추가 학습된 대형 언어 모델인 미네르바(Minerva)를 소개합니다. 이 모델은 외부 도구를 사용하지 않고 기술적 벤치마크에서 최고 수준의 성능을 달성하였습니다. 또한, 물리학, 생물학, 화학, 경제학 등 양적 추론이 필요한 200여 개 이상의 대학교 수준 문제에 대해 우리의 모델을 평가한 결과, 이 모델이 거의 세 분의 일의 문제들을 올바르게 답할 수 있음을 확인하였습니다.

언어 모델을 사용한 양적 추론 문제 해결 | 최신 연구 논문 | HyperAI초신경