일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 파이썬
- 머신 러닝
- 국민대학교
- Regression
- 정렬
- 회귀
- 스택
- kmu
- SQL
- OS
- LSTM
- 국민대
- googleapiclient
- 재귀
- 운영체제
- machine learning
- Heap
- Python
- C++
- PANDAS
- 데이터베이스
- programmers
- gan
- python3
- instaloader
- GIT
- db
- 프로그래머스
- Seq2Seq
- Stack
- Today
- Total
목록개념 정리/통계 (6)
정리 노트
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 2024.01.11 - [개념 정리/통계] - 대푯값을 비교하는 여러가지 방법 포스트에서는 데이터가 양적 변수라는 가정이 있었습니다. 하지만 데이터는 양적 변수만 있는 것이 아닙니다. 동전 던지기를 생각하면 변수는 '앞면'과 '뒷면'만 있습니다. 이러한 변수는 범주형 변수입니다. 동전 던지기 같은 상황에서 모집단은 범주형 변수로 이루어져 있을 것입니다. 이때의 파라미터는 앞면(또는 뒷면)이 나올 확률입니다. 이 확률을 추정하거나 확률에 대한 가설을 세워 검정을 진행할 ..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 대푯값을 평균으로 생각하고 포스트를 작성하겠습니다. 모수 검정의 평균값 비교 일표본 t 검정 이 방법은 두 집단의 표본 평균을 가지고 검정을 하는 방법이 아니라 하나의 집단의 표본 평균을 가지고 모평균을 추정하는 검정 방식입니다. 이 검정 방법을 채택할 때 귀무가설과 대립 가설은 주로 아래와 같이 설정됩니다. 귀무가설: 모집단의 평균은 xx이다. 대립 가설: 모집단의 평균은 xx 이 아니다. 예를 들면 "한국인 성인 남성 평균 키는 170cm이다."라고 귀무가설을 세울..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 귀무가설과 대립가설은 서로 부정 관계에 있기 때문에 한 쪽이 옳다면 다른 쪽은 틀린 것이 됩니다. 따라서 진실은 귀무가설이 옳은 경우와 대립가설이 옳은 경우 2가지 패턴으로 나뉩니다. 그리고 p값을 계산해 유의 수준 \( \alpha \)와 비교해 대립가설을 지지할지 않을지 판단합니다. 여기서 귀무가설을 기각하는 것과 할수 없는 것 2가지 패턴으로 나뉩니다. 이를 합친 진실과 판단은 2 x 2 패턴입니다. 귀무가설이 옳음 대립가설이 옳음 귀무가설을 기각하지 않음 OK ..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 이 포스트는 아래의 포스트의 내용에서 이어집니다. 가설 검정의 원리 이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | prod study-note-99.tistory.com 가설 검정의 구체적인 계산 요즘은 p-value를 직접 계산하지 않고 R 등의 통계 분석 소프트웨어에서 계산해 줍니다. 그래도 여기서는 개념을 더 이해하..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 가설 검정은 분석자가 가설을 검증하기 위한 방법으로 p값(p-value)을 계산해 가설을 지지하는지 여부를 결정합니다. 흔히 신약을 투여한 집단과 위약을 투여한 집단을 비교함으로써 신약의 효과를 검증하는 데이터 분석 예시를 많이 사용합니다. 그러니 여기도 이 예시를 사용하겠습니다. 저희는 "신약이 혈압을 낮추는데 효과가 있다"는 가설을 세우고 이야기를 진행합니다. 실험 데이터(최고 혈압(단위: mmHg))는 아래와 같다고 합시다. 신약 위약 142 145 132 130..
이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | product.kyobobook.co.kr 표본 오차 평균이 \( \mu \)인 모집단에서 표본을 얻는다고 합시다. 이 표본들의 평균을 계산해 모집단의 평균을 추측하려 합니다. 만약 이 표본 평균이 모평균과 같은 값을 가진다면 모집단을 알게 된다는 것입니다. 하지만 이럴 가능성은 거의 없습니다. 일반적으로 모평균과 표본 평균은 일치하지 않습니다. 이런 오차를 표본 오차(표집 오차, sampling error)라 합니다. 이러한 오차는 모집단에서 표본을 선택하는데 발생하는 피할 수 없는 오차입니다. 표본 오차는 ..