HyperAIHyperAI

Command Palette

Search for a command to run...

TinyStories 단편 소설 합성 데이터 세트

날짜

2년 전

크기

4.21 GB

조직

Microsoft Research

Paper URL

arxiv.org

이 데이터 세트는 GPT-3.5와 GPT-4에서 생성한 단편 소설의 합성 데이터 세트이며, 포함된 어휘는 3~4세 어린이의 이해 범위로 제한됩니다. 소규모 언어 모델(LM)을 훈련하고 평가하도록 설계되었으며, 규모가 작음(매개변수 500만 개 미만)이나 아키텍처가 더 단순함(변환 블록이 하나만 있음)에도 불구하고 이 데이터 세트로 훈련된 모델은 유창하고 일관되며 다양하고 문법적으로 거의 완벽한 단편 소설을 생성할 수 있습니다. TinyStories 데이터 세트는 2023년 Microsoft Research에서 제안되었으며 관련 논문은 “TinyStories: 언어 모델은 얼마나 작아도 일관된 영어를 말할 수 있을까?"

TinyStories.torrent
시딩 2다운로드 중 0완료됨 200총 다운로드 수 459
  • TinyStories/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • TinyStories.zip
          4.21 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp