Cflue
المقاييس
llm_model
model_url
organization
parameters
prediction_acc (%)
prediction_f1 (%)
reasoning_bleu-1
reasoning_bleu-4
reasoning_rouge-1
reasoning_rouge-2
reasoning_rouge-l
release_date
updated_time
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | llm_model | model_url | organization | parameters | prediction_acc (%) | prediction_f1 (%) | reasoning_bleu-1 | reasoning_bleu-4 | reasoning_rouge-1 | reasoning_rouge-2 | reasoning_rouge-l | release_date | updated_time |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
النموذج 1 | GPT-4-turbo | https://help.openai.com/en/articles/8555510-gpt-4-turbo-in-the-openai-api | OpenAI | N/A | 60.61±0.21 | 60.31±0.19 | 30.66±0.22 | 10.61±0.13 | 40.28±0.20 | 17.23±0.15 | 28.62±0.19 | 2024.5.26 | 2024.8.11 |