Home News Papers Tutorials Datasets Wiki SOTA LLM Models GPU Leaderboard Events

English

Multiple Choice Question Answering Mcqa On 30

Metrics

Accuracy

Results

Performance results of various models on this benchmark

Model Name	Accuracy	Paper Title	Repository
BLOOM 176B (few-shot, k=3)	54.8	BloombergGPT: A Large Language Model for Finance
Bloomberg GPT (few-shot, k=3)	56	BloombergGPT: A Large Language Model for Finance
Gopher-280B (few-shot, k=5)	38.6	Scaling Language Models: Methods, Analysis & Insights from Training Gopher
GPT-NeoX (few-shot, k=3)	54	BloombergGPT: A Large Language Model for Finance
PaLM 2 (few-shot, k=3, CoT)	83.6	PaLM 2 Technical Report
PaLM 540B (few-shot, k=3)	76	BloombergGPT: A Large Language Model for Finance
Chinchilla-70B (few-shot, k=5)	47.1	Training Compute-Optimal Large Language Models
PaLM 2 (few-shot, k=3, Direct)	90	PaLM 2 Technical Report
OPT 66B (few-shot, k=3)	52.8	BloombergGPT: A Large Language Model for Finance

0 of 9 row(s) selected.