정리 노트

KDD(Knowledge Discovery in Database) 본문

개념 정리

KDD(Knowledge Discovery in Database)

꿈만 꾸는 학부생 2023. 9. 4. 20:22
728x90

KDD 프로세스는 데이터로부터 지식을 얻는 데이터 마이닝 프로세스로 머신 러닝이나 패턴 인식, 데이터베이스, 통계, 인공 지능, 데이터 시각화 등을 연구하는 사람들이 관심을 갖는 주제입니다.

KDD의 9개의 프로세스

source: https://www2.cs.uregina.ca/~dbd/cs831/notes/kdd/1_kdd.html

프로세스 과정을 9개의 프로세스 또는 5개의 단계로 설명할 수 있습니다. 여기서는 9개의 프로세스 과정으로 설명하겠습니다.

  1. 이해(비즈니스 도메인, 선수 지식 등)
  2. 목표 data set 생성(검색할 변수를 포함하는 하위 data set을 선택하는 것도 가능)
  3. 데이터 정제 및 전처리(noise 및 outlier 값 제거, 필요 정보만 추출, 결측치에 대한 처리 등)
  4. 데이터 차원 축소
  5. 데이터 마이닝 방법 결정(KDD 프로세스의 목적이 분류, 회귀, 군집화 아님 다른 것들 중 무엇인지 결정)
  6. 데이터 마이닝 방법에 맞는 알고리즘 결정
  7. 데이터 마이닝 진행
  8. 결과 해석
  9. 해석을 통해 얻은 지식들을 통합

이 프로세스는 필요하다면 전의 프로세스로 돌아갈 수 있다는 특징을 가지고 있습니다. 그리고 요구사항이 정의가 되었을 때에 적용할 수 있습니다.

 

참고 자료

728x90

'개념 정리' 카테고리의 다른 글

이메일 프로토콜  (0) 2023.07.25
HTTP 프로토콜  (0) 2023.07.21
간단한 데이터베이스의 설계 설명  (0) 2023.07.16
Bloom Filters  (0) 2023.06.13
Reservoir Sampling  (0) 2023.06.11