HyperAI超神経

Studenteval

評価指標

first failure
first success
humaneval
last failure
last success
llm_model
model_url
organization
parameters
release_date
updated_time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名first failurefirst successhumanevallast failurelast successllm_modelmodel_urlorganizationparametersrelease_dateupdated_time
モデル 111.7644.8448.1013.9047.40GPT-3.5-Turbo-0301https://platform.openai.com/docs/modelsOpenAIN/A2023.3.12024.8.11