Command Palette

Search for a command to run...

ShareGPT 90k 중국어 및 영어 이중 언어 인간-기계 질의응답 데이터 세트

날짜

2년 전

크기

730.58 MB

ShareGPT-Chinese-English-90k는 실제적이고 복잡한 시나리오에서 사용자 질문을 다루는, 중국어와 영어를 병행하여 사용하는 고품질의 인간-기계 질의응답 데이터 세트입니다. 고품질 대화형 모델을 훈련하는 데 사용할 수 있습니다(이 모델은 기계에서 생성된 질문과 답변을 시뮬레이션하기 위해 API 인터페이스를 반복적으로 호출하여 생성된 데이터보다 명령 분배 측면에서 더욱 강력합니다).

이 데이터 세트의 특징은 다음과 같습니다.

  • 동시에, 의미가 정확히 동일한 중국어와 영어 병렬 비교 코퍼스를 제공하여 이중 언어 대화 모델 훈련에 활용할 수 있습니다.
  • 모든 질문은 API 폴링(예: Moss)을 통해 인위적으로 상상하거나 생성된 가짜 데이터가 아니며, 실제 사용자 시나리오의 명령 배포 및 질문 표현과 더 일치합니다.
  • Sharegpt 데이터 세트는 네티즌들의 자발적인 공유를 통해 수집되는데, 이는 매우 자연스러운 필터링(인간의 감각을 통한)과 동일하며, 나쁜 경험이 있는 대화의 대부분을 걸러냅니다.
ShareGPT-Chinese-English-90k.torrent
시딩 1다운로드 중 0완료됨 294총 다운로드 횟수 723
  • ShareGPT-Chinese-English-90k/
    • README.md
      1.5 KB
    • README.txt
      2.99 KB
      • data/
        • sharegpt-ec.zip
          730.58 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
ShareGPT 90k 중국어 및 영어 이중 언어 인간-기계 질의응답 데이터 세트 | 데이터셋 | HyperAI초신경