HyperAI초신경

데이터 전처리

데이터 전처리는 데이터를 분석하기 전에 데이터를 조작, 필터링 또는 향상시키는 것을 말하며, 일반적으로 데이터 마이닝 프로세스에서 중요한 단계입니다.데이터 전처리의 목표는 데이터 품질을 개선하고 특정 데이터 마이닝 작업에 더 적합하게 만드는 것입니다.

데이터 전처리의 일반적인 단계

데이터 전처리는 원시 데이터를 정리하고 변환하여 분석에 적합하게 만드는 작업입니다. 데이터 전처리의 몇 가지 일반적인 단계는 다음과 같습니다.

  • 데이터 정리:여기에는 누락된 값, 이상치, 중복 등 데이터의 오류나 불일치를 식별하고 수정하는 작업이 포함됩니다. 데이터 정리는 대체, 삭제, 변환 등 다양한 기술을 사용하여 수행할 수 있습니다.
  • 데이터 통합:이는 여러 소스의 데이터를 결합하여 통합된 데이터 세트를 만드는 것을 의미합니다. 데이터 통합은 서로 다른 형식, 구조, 의미를 가진 데이터를 처리해야 하기 때문에 어려울 수 있습니다. 데이터 통합은 레코드 연결 및 데이터 융합과 같은 기술을 사용하여 수행할 수 있습니다.

참고문헌

【1】https://en.wikipedia.org/wiki/Data_Preprocessing

【2】https://www.geeksforgeeks.org/data-preprocessing-in-data-mining/