Infobench
평가 지표
easy set
hard set
llm_model
model_url
organization
overall
parameters
release_date
updated_time
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | easy set | hard set | llm_model | model_url | organization | overall | parameters | release_date | updated_time |
---|---|---|---|---|---|---|---|---|---|
모델 1 | 90.1 | 89.1 | gpt-4-1106-preview | https://platform.openai.com/docs/models | OpenAI | 89.4 | N/A | 2023.11.6 | 2024.8.11 |