데이터 마이닝
데이터 마이닝(약칭 DM)은 컴퓨터 과학의 학제간 분야입니다. 이는 인공지능, 머신러닝, 통계학, 데이터베이스의 교차점을 활용하여 비교적 대규모 데이터 세트에서 패턴을 발견하는 계산 과정입니다.대규모 데이터 세트를 처리하고 탐색하기 위해 분석에 사용되는 컴퓨터 지원 기술입니다. 데이터 마이닝 도구와 방법의 도움으로 조직은 데이터 속에 숨겨진 패턴과 관계를 발견할 수 있습니다. 데이터 마이닝은 원시 데이터를 유용한 지식으로 변환합니다. 기업은 이러한 지식을 활용해 문제를 해결하고, 사업 결정의 미래 영향을 분석하고, 수익 마진을 개선할 수 있습니다.데이터 마이닝의 목적은 데이터 자체를 추출하거나 채굴하는 것이 아닙니다. 그 대신, 이미 엄청난 양의 데이터가 존재하고, 데이터 마이닝은 이 데이터에서 의미 있거나 가치 있는 지식을 추출하는 것입니다.
데이터 마이닝의 유형
데이터 마이닝은 데이터와 마이닝 목적에 따라 여러 분야나 전문 분야로 나뉠 수 있습니다. 다음은 데이터 마이닝의 몇 가지 예입니다.
프로세스 마이닝
프로세스 마이닝은 비즈니스 프로세스를 발견하고, 모니터링하고, 개선하는 것을 목표로 하는 데이터 마이닝의 한 분야입니다. 정보 시스템에서 사용 가능한 이벤트 로그에서 지식을 추출하고 조직이 이러한 프로세스에서 매일 발생하는 일을 이해하는 데 도움이 됩니다.
예를 들어, 전자상거래 사업에는 구매, 판매, 지불, 지불금 수령, 배송 등 많은 프로세스가 있습니다. 조달 데이터 로그를 마이닝하면 공급업체의 납품 신뢰도가 54%라는 사실을 알아낼 수도 있고, 항상 일정보다 앞서 납품하는 신뢰도가 12%인 공급업체가 있다는 사실도 알아낼 수 있습니다. 그들은 이 정보를 사용하여 공급업체와의 관계를 최적화할 수 있습니다.
텍스트 마이닝
텍스트 마이닝 또는 텍스트 데이터 마이닝은 데이터 마이닝 소프트웨어를 사용하여 텍스트를 읽고 이해합니다. 데이터 과학자는 텍스트 마이닝을 사용하여 웹사이트, 책, 이메일, 리뷰, 기사 등의 서면 소스에서 자동으로 지식을 발견합니다.
예를 들어, 디지털 미디어 회사는 텍스트 마이닝을 사용하여 온라인 비디오의 댓글을 자동으로 읽고 시청자의 댓글을 긍정적 또는 부정적으로 분류할 수 있습니다.
예측 마이닝
예측 데이터 마이닝은 비즈니스 인텔리전스를 사용하여 추세를 예측합니다. 기업 리더들이 자신의 결정이 회사의 미래에 미치는 영향을 연구하고 효과적인 선택을 내리는 데 도움이 됩니다.
예를 들어, 회사는 손실이 발생하지 않는 보증 계획을 설계하기 위해 과거 제품 반품 데이터를 살펴볼 수 있습니다. 예측 마이닝을 사용하여 내년에 발생할 수 있는 잠재적 수익 수를 예측하고 제품 가격을 결정할 때 손실을 고려한 1년 보증 계획을 수립합니다.
참고문헌
【1】https://zh.wikipedia.org/wiki/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98