Command Palette

Search for a command to run...

LongAlign 10K 대형 모델 긴 컨텍스트 정렬 데이터 세트

날짜

2년 전

크기

392.42 MB

기관

칭화대학교

LongAlign-10k는 청화대학교에서 장기 컨텍스트 정렬 작업에서 대규모 모델이 겪는 과제를 해결하기 위해 제안한 데이터 세트입니다. 여기에는 길이가 8k에서 64k 사이인 10,000개의 긴 명령어 데이터가 포함되어 있습니다.

데이터 세트를 구축하는 과정에서 먼저 책, 백과사전, 학술 논문, 코드 등 9개의 다양한 분야에서 자료를 추출한 다음, Claude 2.1 대규모 모델을 사용하여 긴 맥락에서 다양한 작업과 답변을 생성합니다. 이 데이터 세트는 긴 맥락에서 대형 모델의 성능과 10k-100k 길이의 작업 지침을 따르는 능력을 평가하도록 설계되었습니다.

LongAlign.torrent
시딩 2다운로드 중 0완료됨 268총 다운로드 횟수 422
  • LongAlign/
    • README.md
      1.28 KB
    • README.txt
      2.57 KB
      • data/
        • LongAlign-10k.zip
          392.42 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp