HyperAI
Command Palette
Search for a command to run...
구텐베르크 데이터셋 전자책 데이터셋
구텐베르크 데이터 세트에는 142명의 저자가 쓴 영어 책 3036권이 포함되어 있습니다. 이는 Project Gutenberg 코퍼스의 작은 부분이며 주로 언어 모델링에 사용됩니다. 이 데이터 세트는 2014년 4월 Microft Artificial Intelligence에서 공개되었습니다. 주요 게시자는 Matthew D. Scholefield였습니다. 관련 논문은 "단어 결합 네트워크의 복잡성: 예비 구조 분석"입니다.
이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.