HyperAI초신경

Studenteval

평가 지표

first failure
first success
humaneval
last failure
last success
llm_model
model_url
organization
parameters
release_date
updated_time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
first failure
first success
humaneval
last failure
last success
llm_model
model_url
organization
parameters
release_date
updated_time
Paper TitleRepository
API11.7644.8448.1013.9047.40GPT-3.5-Turbo-0301https://platform.openai.com/docs/modelsOpenAIN/A2023.3.12024.8.11--
0 of 1 row(s) selected.