Command Palette

Search for a command to run...

LongCite-45k 대규모 모델 세분화 개선 데이터 세트

날짜

일 년 전

크기

1.7 GB

기관

칭화대학교

발행 주소

github.com

논문 URL

arxiv.org

LongCite-45k는 칭화대학교에서 2024년에 출시한 오픈소스 데이터 세트입니다. 이 데이터 세트의 목표는 장문 텍스트 질의응답 과제에서 대규모 언어 모델(LLM)의 신뢰성과 검증 가능성을 개선하는 것입니다. 관련 논문 결과는 다음과 같습니다.LongCite: LLM이 장문 컨텍스트 QA에서 세분화된 인용을 생성할 수 있도록 지원".

이 데이터 세트에는 문장 단위 인용이 포함된 44,600개의 고품질 질의응답 데이터가 포함되어 있으며, 최대 128k 토큰 길이의 긴 텍스트 처리를 지원하고, 사용자가 세분화된 문장 단위 인용을 생성하여 모델의 답변의 정확성을 검증할 수 있도록 합니다.

LongCite-45k.torrent
시딩 1다운로드 중 0완료됨 159총 다운로드 횟수 201
  • LongCite-45k/
    • README.md
      1.22 KB
    • README.txt
      2.45 KB
      • data/
        • LongCite-45k.zip
          1.7 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
LongCite-45k 대규모 모델 세분화 개선 데이터 세트 | 데이터셋 | HyperAI초신경