Command Palette

Search for a command to run...

브라운 코퍼스

날짜

3년 전

크기

9.09 MB

기관

브라운 대학교

발행 주소

www.kaggle.com

브라운 코퍼스는 다양한 주제에 대한 신문 텍스트, 서적, 정부 문서에서 추출한 최초의 미국 영어 텍스트 코퍼스입니다. 1,014,312개의 단어를 포함하고 있으며 주로 언어 모델링에 사용됩니다.

원래 코퍼스에는 수동으로 주석이 달린 문장, 토큰 경계, 단어 클래스 주석이 포함되어 있는 반면, 변환된 코퍼스에는 Brown 코퍼스의 TEI/XML 버전을 기반으로 재구성된 전체 텍스트가 포함되어 있으며 OLiA를 통해 집계 쿼리를 위해 온톨로지 단어 클래스에 연결되었습니다.

이 코퍼스는 원래 1963-1964년에 브라운 대학 언어학과의 W. 넬슨 프랜시스와 헨리 쿠체라가 "현대 미국 영어의 계산 분석"이라는 논문으로 출판했습니다.

Brown Corpus.torrent
시딩 4다운로드 중 0완료됨 1,681총 다운로드 횟수 3,697
  • Brown Corpus/
    • README.md
      1.49 KB
    • README.txt
      2.97 KB
      • data/
        • Brown Corpus.zip
          9.09 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
브라운 코퍼스 | 데이터셋 | HyperAI초신경