HyperAIHyperAI

Command Palette

Search for a command to run...

LongBench-Pro 장기 컨텍스트 종합 평가 데이터 세트

날짜

4달 전

라이선스

Apache 2.0

LongBench-Pro는 장문 문맥 언어 모델 평가를 위해 2025년에 공개된 데이터셋입니다. 이 데이터셋은 다양한 문맥 길이, 작업 유형 및 운영 조건에서 모델이 장문 텍스트를 이해하고 처리하는 능력을 체계적으로 평가하는 것을 목표로 합니다. 이 데이터셋은 1,500개의 샘플로 구성되어 있으며, 레벨 1 작업 11개와 레벨 2 작업 25개를 포함합니다. 작업은 문맥 사용 여부에 따라 전체 문맥 작업과 부분 문맥 작업으로 분류됩니다. 영어 및 중국어 샘플이 모두 포함되어 있으며, 영어와 중국어 데이터의 분포는 균형적입니다. 작업 난이도는 쉬움, 중간, 어려움, 매우 어려움의 네 단계로 분류됩니다. 문맥 길이는 8,000개 토큰부터 256,000개 토큰까지 6가지 범위로 고르게 분포되어 있습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp