HyperAIHyperAI

Command Palette

Search for a command to run...

WikiText 장기 의존성 언어 모델링 데이터 세트 장기 의존성 언어 모델링 데이터 세트

날짜

3년 전

크기

373.28 MB

조직

Salesforce Research

WikiText 장기 의존 언어 모델링 데이터 세트에는 Wikipedia의 고품질 문서와 벤치마크 문서에서 가져온 1억 개의 영어 단어가 포함되어 있습니다. 이 데이터 세트는 WikiText-2와 WikiText-103의 두 가지 버전으로 나뉩니다. PTB 어휘와 비교했을 때 규모가 더 크고 각 단어에 관련 원본 기사가 그대로 유지되므로 자연어 모델링에 장기적으로 의존해야 하는 시나리오에 적합합니다. 이 데이터 세트는 2016년 Salesforce Research에서 공개했으며, 주요 게시자는 Stephen Merity, Caiming Xiong, James Bradbury, Richard Socher입니다. 관련 논문은 "포인터 센티넬 혼합 모델"입니다.

WikiText Long Term Dependency Language Modeling Dataset.torrent
시딩 3다운로드 중 0완료됨 1,318총 다운로드 수 2,338
  • WikiText Long Term Dependency Language Modeling Dataset/
    • README.md
      1.46 KB
    • README.txt
      2.92 KB
      • data/
        • wikitext-2-v1.zip
          373.28 MB
        • wikitext-103-v1.zip
          364.51 MB
        • wikitext-2-raw-v1.zip
          369.01 MB
        • 新建文本文档.txt
          373.28 MB
        • wikitext-103-raw-v1.zip
          183.09 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp