Newsbench

メトリクス

jwp-mcqs

jwp-saqs

llm_model

model_url

organization

parameters

release_date

sa-mcqs

sa-saqs

updated_time

結果

このベンチマークにおける各種モデルのパフォーマンス結果

											論文タイトル	コード
API	0.456	2.4438	GPT-4-1106	https://huggingface.co/UvaldeAI/gpt-4-1106-preview	OpenAI	N/A	2023.11.6	0.9068	0.9	2024.6.4	-

0 of 1 row(s) selected.

Newsbench

メトリクス

jwp-mcqs

jwp-saqs

llm_model

model_url

organization

parameters

release_date

sa-mcqs

sa-saqs

updated_time

結果

このベンチマークにおける各種モデルのパフォーマンス結果

											論文タイトル	コード
API	0.456	2.4438	GPT-4-1106	https://huggingface.co/UvaldeAI/gpt-4-1106-preview	OpenAI	N/A	2023.11.6	0.9068	0.9	2024.6.4	-

0 of 1 row(s) selected.

Newsbench | SOTA | HyperAI超神経