Command Palette

Search for a command to run...

TinyStories 단편 소설 합성 데이터 세트

날짜

일 년 전

크기

4.21 GB

기관

마이크로소프트 리서치

논문 URL

arxiv.org

* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

이 데이터 세트는 GPT-3.5와 GPT-4에서 생성한 단편 소설의 합성 데이터 세트이며, 포함된 어휘는 3~4세 어린이의 이해 범위로 제한됩니다. 소규모 언어 모델(LM)을 훈련하고 평가하도록 설계되었으며, 규모가 작음(매개변수 500만 개 미만)이나 아키텍처가 더 단순함(변환 블록이 하나만 있음)에도 불구하고 이 데이터 세트로 훈련된 모델은 유창하고 일관되며 다양하고 문법적으로 거의 완벽한 단편 소설을 생성할 수 있습니다.

TinyStories 데이터 세트는 2023년 Microsoft Research에서 제안되었으며 관련 논문은 “TinyStories: 언어 모델은 얼마나 작아도 일관된 영어를 말할 수 있을까?"

TinyStories.torrent
시딩 1다운로드 중 0완료됨 176총 다운로드 횟수 376
  • TinyStories/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • TinyStories.zip
          4.21 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
TinyStories 단편 소설 합성 데이터 세트 | 데이터셋 | HyperAI초신경