HyperAI초신경

홈 플랫폼 문서 뉴스 연구 논문 튜토리얼 데이터셋 백과사전 SOTA LLM 모델 GPU 랭킹 컨퍼런스

한국어

HyperAI초신경

Question Answering On Peerqa

평가 지표

AlignScore

Prometheus-2 Answer Correctness

Rouge-L

평가 결과

이 벤치마크에서 각 모델의 성능 결과

				Paper Title	Repository
GPT-3.5-Turbo-0613-16k	0.1378	3.0408	0.2414	Language Models are Few-Shot Learners
Command-R-v01-34B	0.1362	3.0571	0.2294	-	-
GPT-4o-2024-08-06-128k	0.1224	3.4612	0.2266	GPT-4 Technical Report
Llama-3-IT-8B-8k	0.1098	3.1102	0.2295	The Llama 3 Herd of Models
Llama-3-IT-8B-32k	0.1016	3.1673	0.2286	The Llama 3 Herd of Models
Mistral-v02-7B-32k	0.0827	3.4245	0.1922	Mistral 7B

0 of 6 row(s) selected.