Command Palette

Search for a command to run...

Updesh 인도어 합성 텍스트 데이터 세트

날짜

3달 전

크기

16.09 GB

기관

마이크로소프트

Updesh는 Microsoft가 2025년에 공개한 인도어 합성 텍스트 데이터 세트로, 인도어에 대한 대규모 언어 모델(LLM)의 사후 학습을 용이하게 하기 위해 만들어졌습니다.

이 데이터 세트에는 아삼어, 벵골어, 구자라트어, 힌디어, 칸나다어, 말라얄람어, 마라티어, 네팔어, 오디아어, 펀자브어, 타밀어, 텔루구어, 우르두어 언어로 된 6,800,000개의 추론 데이터와 2,100,000개의 생성된 데이터가 포함되어 있습니다.

Updesh_beta.torrent
시딩 1다운로드 중 0완료됨 62총 다운로드 횟수 81
  • Updesh_beta/
    • README.md
      1.2 KB
    • README.txt
      2.4 KB
      • data/
        • Updesh_beta.zip
          16.09 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
Updesh 인도어 합성 텍스트 데이터 세트 | 데이터셋 | HyperAI초신경