일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- Python
- Stack
- 정렬
- 국민대학교
- programmers
- python3
- machine learning
- 데이터베이스
- 재귀
- GIT
- Regression
- 프로그래머스
- 운영체제
- 머신 러닝
- db
- 회귀
- gan
- LSTM
- PANDAS
- OS
- SQL
- 스택
- Heap
- C++
- googleapiclient
- instaloader
- kmu
- Seq2Seq
- 국민대
- 파이썬
Archives
- Today
- Total
정리 노트
KDD(Knowledge Discovery in Database) 본문
728x90
KDD 프로세스는 데이터로부터 지식을 얻는 데이터 마이닝 프로세스로 머신 러닝이나 패턴 인식, 데이터베이스, 통계, 인공 지능, 데이터 시각화 등을 연구하는 사람들이 관심을 갖는 주제입니다.
KDD의 9개의 프로세스
프로세스 과정을 9개의 프로세스 또는 5개의 단계로 설명할 수 있습니다. 여기서는 9개의 프로세스 과정으로 설명하겠습니다.
- 이해(비즈니스 도메인, 선수 지식 등)
- 목표 data set 생성(검색할 변수를 포함하는 하위 data set을 선택하는 것도 가능)
- 데이터 정제 및 전처리(noise 및 outlier 값 제거, 필요 정보만 추출, 결측치에 대한 처리 등)
- 데이터 차원 축소
- 데이터 마이닝 방법 결정(KDD 프로세스의 목적이 분류, 회귀, 군집화 아님 다른 것들 중 무엇인지 결정)
- 데이터 마이닝 방법에 맞는 알고리즘 결정
- 데이터 마이닝 진행
- 결과 해석
- 해석을 통해 얻은 지식들을 통합
이 프로세스는 필요하다면 전의 프로세스로 돌아갈 수 있다는 특징을 가지고 있습니다. 그리고 요구사항이 정의가 되었을 때에 적용할 수 있습니다.
참고 자료
- https://kadensungbincho.tistory.com/73 - 비즈니스 도메인이란?
- https://www2.cs.uregina.ca/~dbd/cs831/notes/kdd/1_kdd.html - Overview of the KDD Process
- https://www.linkedin.com/pulse/knowledge-discovery-data-kdd-process-mohammad-valadkhani - Knowledge Discovery in Data (KDD) Process
728x90
'개념 정리' 카테고리의 다른 글
이메일 프로토콜 (0) | 2023.07.25 |
---|---|
HTTP 프로토콜 (0) | 2023.07.21 |
간단한 데이터베이스의 설계 설명 (0) | 2023.07.16 |
Bloom Filters (0) | 2023.06.13 |
Reservoir Sampling (0) | 2023.06.11 |