Discord에서 논의하기

날짜

6달 전

라이선스

Apache 2.0

태그

자연어 처리

LongBench-Pro는 장문 문맥 언어 모델 평가를 위해 2025년에 공개된 데이터셋입니다. 이 데이터셋은 다양한 문맥 길이, 작업 유형 및 운영 조건에서 모델이 장문 텍스트를 이해하고 처리하는 능력을 체계적으로 평가하는 것을 목표로 합니다. 이 데이터셋은 1,500개의 샘플로 구성되어 있으며, 레벨 1 작업 11개와 레벨 2 작업 25개를 포함합니다. 작업은 문맥 사용 여부에 따라 전체 문맥 작업과 부분 문맥 작업으로 분류됩니다. 영어 및 중국어 샘플이 모두 포함되어 있으며, 영어와 중국어 데이터의 분포는 균형적입니다. 작업 난이도는 쉬움, 중간, 어려움, 매우 어려움의 네 단계로 분류됩니다. 문맥 길이는 8,000개 토큰부터 256,000개 토큰까지 6가지 범위로 고르게 분포되어 있습니다.

소환

@misc{chen2026longbenchprorealisticcomprehensive, 제목={LongBench Pro: 보다 현실적이고 포괄적인 이중 언어 장기 맥락 평가 벤치마크}, 저자={Ziyang Chen, Xing Wu, Junlong Jia, Chaochen Gao, Qi Fu, Debing Zhang, Songlin Hu}, 연도={2026}, eprint={2601.02872}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2601.02872}, }

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Discord에서 논의하기

날짜

6달 전

라이선스

Apache 2.0

태그

자연어 처리

LongBench-Pro는 장문 문맥 언어 모델 평가를 위해 2025년에 공개된 데이터셋입니다. 이 데이터셋은 다양한 문맥 길이, 작업 유형 및 운영 조건에서 모델이 장문 텍스트를 이해하고 처리하는 능력을 체계적으로 평가하는 것을 목표로 합니다. 이 데이터셋은 1,500개의 샘플로 구성되어 있으며, 레벨 1 작업 11개와 레벨 2 작업 25개를 포함합니다. 작업은 문맥 사용 여부에 따라 전체 문맥 작업과 부분 문맥 작업으로 분류됩니다. 영어 및 중국어 샘플이 모두 포함되어 있으며, 영어와 중국어 데이터의 분포는 균형적입니다. 작업 난이도는 쉬움, 중간, 어려움, 매우 어려움의 네 단계로 분류됩니다. 문맥 길이는 8,000개 토큰부터 256,000개 토큰까지 6가지 범위로 고르게 분포되어 있습니다.

소환

@misc{chen2026longbenchprorealisticcomprehensive, 제목={LongBench Pro: 보다 현실적이고 포괄적인 이중 언어 장기 맥락 평가 벤치마크}, 저자={Ziyang Chen, Xing Wu, Junlong Jia, Chaochen Gao, Qi Fu, Debing Zhang, Songlin Hu}, 연도={2026}, eprint={2601.02872}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2601.02872}, }

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp