일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 데이터베이스
- PANDAS
- 운영체제
- machine learning
- 정렬
- GIT
- gan
- Python
- 회귀
- 프로그래머스
- instaloader
- Stack
- LSTM
- 파이썬
- 국민대학교
- C++
- python3
- 스택
- Seq2Seq
- kmu
- Heap
- db
- OS
- SQL
- 재귀
- programmers
- 국민대
- 머신 러닝
- Regression
- googleapiclient
Archives
- Today
- Total
목록bloom filter (1)
정리 노트
Bloom Filters
이 포스트는 국민대학교 소프트웨어학부 '빅데이터최신기술' 강의를 듣고 요약하는 포스트입니다. 원하시는 정보가 없을 수도 있습니다. 이 점 유의 바랍니다. 오류 지적은 매우 환영합니다! 문제 상황 (key, value)의 tuple로 이루어진 스트림이 있다고 합시다. 그러면, key 값들이 담긴 집합 S가 있을 때, 스트림 내의 임의의 튜플이 집합 S에 존재하는지 확인하려면 어떻게 해야 할까요? 가장 쉽게 생각할 수 있는 방법은 집합 S를 hash table에 모두 저장하는 방법입니다. 하지만 스트림으로 들어오는 튜플들의 수가 너무 많다면, 그 많은 튜플들을 하나씩 다 S에 탐색하는데 시간이 오래 걸릴 것입니다. 비트 배열을 사용한 필터링 비트 배열을 사용해 필터링을 하는 방법이 있습니다. 필터링을 해서 ..
개념 정리
2023. 6. 13. 13:56