Newsbench
Metriken
jwp-mcqs
jwp-saqs
llm_model
model_url
organization
parameters
release_date
sa-mcqs
sa-saqs
updated_time
Ergebnisse
Leistungsergebnisse verschiedener Modelle zu diesem Benchmark
Vergleichstabelle
Modellname | jwp-mcqs | jwp-saqs | llm_model | model_url | organization | parameters | release_date | sa-mcqs | sa-saqs | updated_time |
---|---|---|---|---|---|---|---|---|---|---|
Modell 1 | 0.456 | 2.4438 | GPT-4-1106 | https://huggingface.co/UvaldeAI/gpt-4-1106-preview | OpenAI | N/A | 2023.11.6 | 0.9068 | 0.9 | 2024.6.4 |