구텐베르크 데이터셋 전자책 데이터셋

Discord 커뮤니티 참여

구텐베르크 데이터 세트에는 142명의 저자가 쓴 영어 책 3036권이 포함되어 있습니다. 이는 Project Gutenberg 코퍼스의 작은 부분이며 주로 언어 모델링에 사용됩니다.

이 데이터 세트는 2014년 4월 Microft Artificial Intelligence에서 공개되었습니다. 주요 게시자는 Matthew D. Scholefield였습니다. 관련 논문은 "단어 결합 네트워크의 복잡성: 예비 구조 분석"입니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
구텐베르크 데이터셋 전자책 데이터셋 | 데이터셋 | HyperAI초신경