HyperAI

Truthfulqa

المقاييس

% info
% true
% true (gpt-judge)
bleu
bleurt
llm_model
mc1
mc2
model_url
organization
parameters
release_date
rouge
updated_time

النتائج

نتائج أداء النماذج المختلفة على هذا المعيار القياسي

جدول المقارنة
اسم النموذج% info% true% true (gpt-judge)bleubleurtllm_modelmc1mc2model_urlorganizationparametersrelease_daterougeupdated_time
النموذج 197.5520.4420.56-17.18-0.54GPT-3 175B0.210.33https://openai.com/index/gpt-3-apps/OpenAI175B2020.5.28-17.172022.5.8