HyperAI초신경

Reuters-21578 텍스트 분류 데이터 세트

날짜

2년 전

크기

7.78 MB

기관

AT&T 랩스 리서치

발행 주소

archive.ics.uci.edu

카테고리

Reuters – 21578 데이터 세트는 텍스트 분류 연구를 위한 테스트 컬렉션입니다. 이는 다중 클래스, 다중 레이블 데이터 세트로, 향후 몇 년 내에 RCV1로 대체될 것으로 예상됩니다. 데이터 세트에는 90개의 클래스, 7,769개의 훈련 파일, 3,019개의 테스트 파일이 있습니다. 이는 Reuters-21578 벤치마크의 ModApte 하위 디렉토리입니다.

Reuters – 21578 이 데이터 세트는 원래 1987년 CONSTRUE 텍스트 분류 시스템을 개발하는 동안 Carnegie Group과 Reuters가 수집하고 레이블을 지정했습니다. 이 책은 1997년 9월 AT&T Labs Research에서 출판되었습니다. 주요 출판사는 데이비드 D. 루이스였습니다. 관련 논문은 다음과 같습니다.

"텍스트 분류를 위한 의사결정 규칙의 자동 학습"

"텍스트 분류 모델의 언어 독립적 자동 학습을 향하여"

"TCS: 콘텐츠 기반 텍스트 분류를 위한 셸"

"CONSTRUE/TIS: 뉴스 기사 데이터베이스의 콘텐츠 기반 색인 시스템"

reuters21578.torrent
시딩 2다운로드 중 0완료됨 788총 다운로드 횟수 2,178
  • reuters21578/
    • README.md
      1.46 KB
    • README.txt
      2.92 KB
      • data/
        • reuters21578.tar.gz
          7.78 MB