일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- python3
- OS
- programmers
- Stack
- 회귀
- GIT
- kmu
- 재귀
- 국민대학교
- Heap
- 머신 러닝
- Regression
- C++
- 운영체제
- PANDAS
- Seq2Seq
- 정렬
- db
- googleapiclient
- Python
- SQL
- instaloader
- 데이터베이스
- 파이썬
- 국민대
- gan
- 스택
- 프로그래머스
- LSTM
- machine learning
- Today
- Total
목록분류 전체보기 (143)
정리 노트
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 대푯값을 평균으로 생각하고 포스트를 작성하겠습니다. 모수 검정의 평균값 비교 일표본 t 검정 이 방법은 두 집단의 표본 평균을 가지고 검정을 하는 방법이 아니라 하나의 집단의 표본 평균을 가지고 모평균을 추정하는 검정 방식입니다. 이 검정 방법을 채택할 때 귀무가설과 대립 가설은 주로 아래와 같이 설정됩니다. 귀무가설: 모집단의 평균은 xx이다. 대립 가설: 모집단의 평균은 xx 이 아니다. 예를 들면 "한국인 성인 남성 평균 키는 170cm이다."라고 귀무가설을 세울..
이 포스트는 BDA와 이지스 퍼블리싱에서 같이 진행하는 Easy Study 5주 차 내용을 요약하는 포스트입니다. 아래의 도서가 스터디에 사용한 교재입니다. http://www.easyspub.co.kr/20_Menu/BookView/B001/607/PUB www.easyspub.co.kr K-평균 군집화(K-Means Clustering) 모델 K-평균 군집화 모델은 특정 데이터와 이 데이터가 속한 군집의 중심점까지의 거리의 제곱을 최소화하는 K개의 군집을 찾는 비지도 학습 모델입니다. 군집화에 사용되는 알고리즘으로 로이드(Lloyd) 알고리즘과 엘칸(Elkan) 알고리즘이 있습니다. 가장 기본적인 로이드 알고리즘은 아래의 흐름으로 진행됩니다. K개의 중심점을 임의로 선택 각 데이터 샘플마다 가장 가까..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 귀무가설과 대립가설은 서로 부정 관계에 있기 때문에 한 쪽이 옳다면 다른 쪽은 틀린 것이 됩니다. 따라서 진실은 귀무가설이 옳은 경우와 대립가설이 옳은 경우 2가지 패턴으로 나뉩니다. 그리고 p값을 계산해 유의 수준 \( \alpha \)와 비교해 대립가설을 지지할지 않을지 판단합니다. 여기서 귀무가설을 기각하는 것과 할수 없는 것 2가지 패턴으로 나뉩니다. 이를 합친 진실과 판단은 2 x 2 패턴입니다. 귀무가설이 옳음 대립가설이 옳음 귀무가설을 기각하지 않음 OK ..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 이 포스트는 아래의 포스트의 내용에서 이어집니다. 가설 검정의 원리 이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | prod study-note-99.tistory.com 가설 검정의 구체적인 계산 요즘은 p-value를 직접 계산하지 않고 R 등의 통계 분석 소프트웨어에서 계산해 줍니다. 그래도 여기서는 개념을 더 이해하..
이 포스트는 BDA와 이지스 퍼블리싱에서 같이 진행하는 Easy Study 3주 차 내용을 요약하는 포스트입니다. 아래의 도서가 스터디에 사용한 교재입니다. http://www.easyspub.co.kr/20_Menu/BookView/B001/607/PUB www.easyspub.co.kr 결정 트리(Decision Tree) 모델 결정 트리는 입력과 출력 사이의 관계를 트리 구조로 모델링하는 지도 학습 기법입니다. 하나의 feature의 값과 특정 값의 크기를 비교하는 binary 질문을 여러 번 반복해 마지막 단계에서 해당 feature에 대한 출력 값을 맞히는 문제 학습합니다. 결정 트리의 학습 알고리즘은 TDIDT 전략을 사용해 간략하게 구합니다. 전역적으로 최소인 결정 트리를 찾는 문제는 NP-..
이 포스트는 아래의 포스트 내용과 이어집니다. 관계 데이터 연산 - 순수 관계 연산자 이 포스트는 아래의 포스트의 내용과 이어집니다. 관계 데이터 연산 - 집합 연산자 이 포스트는 국민대학교 소프트웨어학부 '데이터베이스' 강의를 듣고 요약하는 포스트입니다. 원하시는 정보 study-note-99.tistory.com Semi-join(⋉) R(X), S(Y)의 조인 속성을 X \( \cap \) Y라고 할 때, S와 join 할 수 있는 R의 tuple들의 집합이 semi-join 연산의 결과입니다. 이를 S에서 R로의 semi-join이라 부릅니다. 이를 식으로 적으면 아래와 같습니다. $$ R ⋉ S = R \Join_{N} ( \Pi_{X \cap Y}(S) ) = \Pi_{X}(R \Join_{N..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 가설 검정은 분석자가 가설을 검증하기 위한 방법으로 p값(p-value)을 계산해 가설을 지지하는지 여부를 결정합니다. 흔히 신약을 투여한 집단과 위약을 투여한 집단을 비교함으로써 신약의 효과를 검증하는 데이터 분석 예시를 많이 사용합니다. 그러니 여기도 이 예시를 사용하겠습니다. 저희는 "신약이 혈압을 낮추는데 효과가 있다"는 가설을 세우고 이야기를 진행합니다. 실험 데이터(최고 혈압(단위: mmHg))는 아래와 같다고 합시다. 신약 위약 142 145 132 130..
이 포스트는 아래의 포스트의 내용과 이어집니다. 관계 데이터 연산 - 집합 연산자 이 포스트는 국민대학교 소프트웨어학부 '데이터베이스' 강의를 듣고 요약하는 포스트입니다. 원하시는 정보가 없을 수도 있습니다. 이 점 유의 바랍니다. 오류 지적은 매우 환영합니다! 테이블 study-note-99.tistory.com 순수 관계 연산자 순수 관계 연산자에 대해 설명할 때 아래의 기호들을 사용하겠습니다. R : 릴레이션(테이블), R(X), X = {\( A_1, ... , A_n \)} \( \rightarrow \) R(\( A_1, ... , A_n \)) r : R의 tuple, r \( \in \) R, r = \( a_i \) : r의 속성 \( A_i \)의 값, r.\(A_i\) = r[\(A_..