브라운 코퍼스는 다양한 주제에 대한 신문 텍스트, 서적, 정부 문서에서 추출한 최초의 미국 영어 텍스트 코퍼스입니다. 1,014,312개의 단어를 포함하고 있으며 주로 언어 모델링에 사용됩니다.
원래 코퍼스에는 수동으로 주석이 달린 문장, 토큰 경계, 단어 클래스 주석이 포함되어 있는 반면, 변환된 코퍼스에는 Brown 코퍼스의 TEI/XML 버전을 기반으로 재구성된 전체 텍스트가 포함되어 있으며 OLiA를 통해 집계 쿼리를 위해 온톨로지 단어 클래스에 연결되었습니다.
이 코퍼스는 원래 1963-1964년에 브라운 대학 언어학과의 W. 넬슨 프랜시스와 헨리 쿠체라가 "현대 미국 영어의 계산 분석"이라는 논문으로 출판했습니다.
Brown Corpus.torrent
시딩 5다운로드 중 0완료됨 1,398총 다운로드 횟수 3,453