HyperAI초신경

위키피디아 위키피디아 데이터 세트

날짜

일 년 전

크기

57.98 GB

기관

발행 주소

huggingface.co

라이선스

CC BY-NC-SA 3.0

카테고리

데이터 세트 요약

위키피디아 데이터 세트에는 모든 언어로 정리된 문서가 포함되어 있습니다.

이 데이터 세트는 다음에서 제공됩니다. 위키피디아 덤프  언어별로 하나의 하위 집합을 만들고, 각 하위 집합을 열 분할로 연결합니다.

각 예시에는 위키백과 문서 전체의 내용이 담겨 있으며, 마크업과 원치 않는 부분(예: "참조")이 제거되어 정리되었습니다.

데이터 시각화

딸깍 하는 소리 노믹 아틀라스  20231101.en 분할의 640만 개 샘플을 시각화한 지도입니다.

라이센스 정보

저작권 라이선스 정보:https://dumps.wikimedia.org/legal.html

모든 원본 텍스트 콘텐츠는 다음을 기반으로 합니다. GNU 자유 문서 라이선스(GFDL) 그리고크리에이티브 커먼즈 저작자표시-동일조건변경허락 3.0 라이선스권한 부여. 일부 텍스트는 크리에이티브 커먼즈 라이선스에 따라서만 제공될 수 있습니다. 그들의 것을 보세요이용 약관. 저자가 쓴 일부 텍스트는 추가 라이선스에 따라 공개되거나 퍼블릭 도메인에 들어갈 수 있습니다.

wikipedia.torrent
시딩 1다운로드 중 2완료됨 181총 다운로드 횟수 453
  • wikipedia/
    • README.md
      1.54 KB
    • README.txt
      3.09 KB
      • data/
        • wikipedia.zip
          57.98 GB