Studenteval
Métriques
first failure
first success
humaneval
last failure
last success
llm_model
model_url
organization
parameters
release_date
updated_time
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | first failure | first success | humaneval | last failure | last success | llm_model | model_url | organization | parameters | release_date | updated_time |
---|---|---|---|---|---|---|---|---|---|---|---|
Modèle 1 | 11.76 | 44.84 | 48.10 | 13.90 | 47.40 | GPT-3.5-Turbo-0301 | https://platform.openai.com/docs/models | OpenAI | N/A | 2023.3.1 | 2024.8.11 |