Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 정렬
- machine learning
- PANDAS
- 회귀
- instaloader
- Stack
- kmu
- 국민대학교
- C++
- Regression
- 운영체제
- Python
- 프로그래머스
- 데이터베이스
- programmers
- googleapiclient
- 스택
- 머신 러닝
- LSTM
- python3
- SQL
- db
- Seq2Seq
- OS
- GIT
- 국민대
- 파이썬
- gan
- 재귀
- Heap
Archives
- Today
- Total
목록데이터 스트림 (1)
정리 노트
Reservoir Sampling
이 포스트는 국민대학교 소프트웨어학부 '빅데이터최신기술' 강의를 듣고 요약하는 포스트입니다. 원하시는 정보가 없을 수도 있습니다. 이 점 유의 바랍니다. 오류 지적은 매우 환영합니다!Reservoir sampling은 데이터 스트림에서 임의의 개수의 데이터를 추출하는 방법입니다. 이를 이해하기 위해서는 data stream에 대해 알아야 할 필요가 있습니다.Data Stream데이터 스트림은 끊임없이 입력되는 데이터를 얘기합니다. 이 데이터는 외부에서 발생해 하나 이상의 경로를 통해 빠르게 입력이 되고, 발생 속도와 빈도가 외부에서 결정됩니다. 대표적인 예시로 은행 거래 내역, 서버 로그 데이터 등이 있습니다. 데이터 스트림에 하는 질의는 주로 2가지로 분류할 수 있습니다.1회성 질의(Ad-hoc que..
개념 정리
2023. 6. 11. 20:58