20 Newsgroups는 약 20,000개의 뉴스 문서로 구성된 데이터 세트이며, 머신 러닝에서 텍스트 응용 실험을 위한 인기 있는 데이터 세트가 되었습니다.
이 데이터 세트는 20개의 서로 다른 뉴스그룹에 균등하게 분포되어 있으며, 텍스트 분류, 텍스트 마이닝, 정보 검색 연구에 사용되는 국제 표준 데이터 세트 중 하나입니다.
20개 뉴스그룹 데이터세트는 1995년 제12회 국제 기계학습 컨퍼런스의 논문집에 켄 랭이 발표했습니다. 관련 논문은 Newsweeder: 넷뉴스 필터링을 배우는 것입니다.
20 Newsgroups.torrent
시딩 2다운로드 중 0완료됨 820총 다운로드 횟수 1,644