Command Palette
Search for a command to run...
데이터 전처리
날짜
데이터 전처리는 데이터를 분석하기 전에 데이터를 조작, 필터링 또는 향상시키는 것을 말하며, 일반적으로 데이터 마이닝 프로세스에서 중요한 단계입니다.데이터 전처리의 목표는 데이터 품질을 개선하고 특정 데이터 마이닝 작업에 더 적합하게 만드는 것입니다.
데이터 전처리의 일반적인 단계
데이터 전처리는 원시 데이터를 정리하고 변환하여 분석에 적합하게 만드는 작업입니다. 데이터 전처리의 몇 가지 일반적인 단계는 다음과 같습니다.
- 데이터 정리:여기에는 누락된 값, 이상치, 중복 등 데이터의 오류나 불일치를 식별하고 수정하는 작업이 포함됩니다. 데이터 정리는 대체, 삭제, 변환 등 다양한 기술을 사용하여 수행할 수 있습니다.
- 데이터 통합:이는 여러 소스의 데이터를 결합하여 통합된 데이터 세트를 만드는 것을 의미합니다. 데이터 통합은 서로 다른 형식, 구조, 의미를 가진 데이터를 처리해야 하기 때문에 어려울 수 있습니다. 데이터 통합은 레코드 연결 및 데이터 융합과 같은 기술을 사용하여 수행할 수 있습니다.
참고문헌
【1】https://en.wikipedia.org/wiki/Data_Preprocessing
【2】https://www.geeksforgeeks.org/data-preprocessing-in-data-mining/