HyperAI
Command Palette
Search for a command to run...
스팸 이메일 탐지 데이터 세트
스팸 이메일 탐지 데이터셋은 스팸 탐지 작업을 위한 레이블이 지정된 이메일 데이터셋으로, 분류 모델링, 자연어 처리 및 특징 엔지니어링 관련 연구를 지원하고 모델의 스팸 식별 능력을 향상시키도록 설계되었습니다. 이 데이터셋은 이메일 제목과 본문 텍스트를 포함하고 있으며, 단어 수, 텍스트 특징, 그리고 추출된 수치적 특징을 제공합니다. 또한 스팸 태그도 포함되어 있어 이진 분류 작업에 활용할 수 있습니다.
데이터 필드:
- 제목: 이메일 제목 내용을 나타내는 문자열입니다.
- email_text: 이메일 본문 텍스트를 나타내는 문자열 유형입니다.
- num_words: 이메일의 단어 수 통계를 나타내는 정수입니다.
- 레이블: 이메일 카테고리 레이블(스팸/스팸 아님)을 나타내는 문자열입니다.
이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.