HyperAI

Studenteval

Metriken

first failure
first success
humaneval
last failure
last success
llm_model
model_url
organization
parameters
release_date
updated_time

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
Modellnamefirst failurefirst successhumanevallast failurelast successllm_modelmodel_urlorganizationparametersrelease_dateupdated_time
Modell 111.7644.8448.1013.9047.40GPT-3.5-Turbo-0301https://platform.openai.com/docs/modelsOpenAIN/A2023.3.12024.8.11