정리 노트

대푯값을 비교하는 여러가지 방법 본문

개념 정리/통계

대푯값을 비교하는 여러가지 방법

꿈만 꾸는 학부생 2024. 1. 11. 18:33
728x90

이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다.

 

통계 101×데이터 분석 | 아베 마사토 - 교보문고

통계 101×데이터 분석 |

product.kyobobook.co.kr


대푯값을 평균으로 생각하고 포스트를 작성하겠습니다.

모수 검정의 평균값 비교

일표본 t 검정

이 방법은 두 집단의 표본 평균을 가지고 검정을 하는 방법이 아니라 하나의 집단의 표본 평균을 가지고 모평균을 추정하는 검정 방식입니다. 이 검정 방법을 채택할 때 귀무가설과 대립 가설은 주로 아래와 같이 설정됩니다.

  • 귀무가설: 모집단의 평균은 xx이다.
  • 대립 가설: 모집단의 평균은 xx 이 아니다.

예를 들면 "한국인 성인 남성 평균 키는 170cm이다."라고 귀무가설을 세울 수 있습니다. 이때 170cm 같은 수치는 연구의 배경으로서 의미가 있는 값으로 설정해야 합니다.

검정을 위한 계산 순서는 흔히 학교에서 통계 시간에 배우는 95% 신뢰 구간을 계산하는 방법과 유사합니다. 다른 점은 가설로 모평균을 지정하는 것인데, 이는 귀무가설이 옳은 세계에서 표본 평균의 분포를 생각하는 것입니다. 이를 수식으로 표현하면 다음과 같습니다.

  1. 표본 오차(\(\bar{x} - \mu\))는 평균이 0이고 표본 오차는 \(s \over \sqrt{n}\)인 정규 분포를 대략적으로 따름
  2. 95% 신뢰 구간: \(0 - 1.96 * {s \over \sqrt{n}} \leq \bar{x} - \mu \leq 0 + 1.96 * {s \over \sqrt{n}}\)
  3. \(\mu\) = xx 일 때 나타날 수 있는 표본 평균의 범위: \(\mu - 1.96 * {s \over \sqrt{n}} \leq \bar{x} \leq \mu + 1.96 * {s \over \sqrt{n}}\)

위에서 구한 범위에 포함되지 않는 극단적인 값이 나올 확률은 p < 0.05가 됩니다. 즉, 95%의 신뢰 구간을 구하는 것과 유의 수준을 0.05로 귀무가설을 검정하는 것은 표본 평균에서의 생각이냐 모평균에서의 생각이냐의 차이일 뿐입니다.

이표본 t검정

두 개의 집단의 평균값을 비교하는 검정 방식으로 귀무가설과 대립 가설을 아래와 같이 지정할 수 있습니다.

  • 귀무가설: 두 집단의 평균은 같다.
  • 대립 가설: 두 집단의 평균은 다르다.

진행 방식은 저번에 적었던 포스트를 참고하시기 바랍니다.

 

가설 검정 시행

이 포스트는 아래의 책의 내용을 정리하며 작성한 포스트입니다. 여기서 사용되는 예시 또한 책의 예시를 사용합니다. 통계 101×데이터 분석 | 아베 마사토 - 교보문고 통계 101×데이터 분석 | prod

study-note-99.tistory.com

이러한 이표본 t검정은 대응 관계가 없는 검정 방법이라 불립니다. 대응 관계가 없다는 것은 두 집단 간에 대응 관계가 존재하지 않음을 의미합니다. 신약 효과 검증을 예로 들면 신약을 투여한 집단과 그러하지 않은 집단의 참여자 수를 모두 10명으로 지정한다는 것은 각 참여자가 경험하는 것은 신약을 먹었다는 것과 먹지 않았다는 것 중 하나뿐입니다.

이를 대응 관계가 있는 검정 방식으로 바꿔보겠습니다. 이럴 때는 한 피험자가 신약 복용 전과 복용 후로 두 차례에 걸쳐서 검사를 진행합니다.(이후 경과 추적을 위해 3회 이상 진행할 수도 있습니다.) 신약의 효과를 확인하기 위해 혈압을 측정한다면 복용 전과 복용 후의 혈압의 변화를 얻을 수 있습니다. 이 변화량에 주목한다면 이는 신약을 복용하기 전의 기준과 비교할 수 있는 한 집단의 데이터임을 알 수 있습니다. 이러면 일표본 t검정으로서, '평균값 차이 = 0'이라는 귀무가설로 삼아 해석할 수 있게 됩니다.

이런 식으로 대응 관계가 있는 데이터면 이에 맞는 검정 방식을 이용하는데 제2종 오류가 발생할 확률이 낮아지며 검정력이 오릅니다.

정규성 조사

이러한 모수 검정 방식들을 사용하려면 집단의 데이터에는 정규성이 있어야 합니다. 이를 조사하는 방법은 여러 가지가 있습니다. 책에서는 각 방법에 대해 자세한 설명은 하지 않았으므로 여기서는 설명 링크만 같이 작성하겠습니다.

등분산성 조사

t검정 같은 검정 방식에는 데이터가 분산이 같은 모집단으로부터 획득됐다는 조건이 필요합니다. 따라서 분산이 같은지를 검정하는 과정이 필요합니다. 이 또한 설명 링크만 같이 작성하겠습니다.

분산 분석(ANOVA, Analysis of variance)

3개 이상의 집단의 평균값을 비교하는 방법으로 아래와 같이 가설을 세우고 진행됩니다.

  • 귀무가설: 모든 집단의 평균은 동일하다.
  • 대립 가설: 적어도 한 쌍에서는 차이가 있다.

먼저 집단 간의 차이를 무시하고 모든 데이터를 사용해 전체 평균과 각 집단의 평균을 계산합니다. 그다음 각 데이터와 데이터 전체 평균과의 차이를 계산합니다. 각 데이터를 \(x_i\) 데이터의 전체 평균을 \(\bar{x}\)라 할 때 \(x_i - \bar{x}\)는 \((x_i - \bar{x}_{x_i\text{가 속한 집단}}) + (\bar{x}_{x_i\text{가 속한 집단}} - \bar{x})\)로 표현할 수 있습니다. 이는 분산을 집단 내의 분산과 집단 간의 분산으로 분해할 수 있음을 의미합니다.

이를 이용해 검정 통계량 F = (평균적인 집단 간 변동) / (평균적인 집단 내 변동)을 계산합니다. 이 검정 통계량은 귀무가설이 옳다면 F 분포를 따릅니다. F 분포에서 계산한 F값 이상으로 극단적인 값이 나올 확률이 p값이 됩니다.

 

F-분포

F-분포는 두 표본의 분산을 비교하는 데 많이 이용되는 분포이다. 통계량 F는 서로 독립인 두 카이제곱변수를 각각의 자유도로 나눈 비로 정의한다. 다시 말해서 서로 독립인 확률변수 U,V가 각각

terms.naver.com

다중 비교 검정

분산 분석을 해서 대립 가설을 채택한다고 해도 어느 쌍에서 차이가 나는지 알 수 없습니다. 어느 쌍에서 차이가 나는지 알기 위해 사용하는 검정 방법이 다중 비교 검정입니다.

t 검정을 반복해서 시행하면 제1종 오류가 일어날 확률이 증가하는 문제가 생깁니다. 이 문제를 회피하기 위해 여러 다중 비교 검정 방법이 나왔습니다.

  • 본페로니 교정: 전체 유의 수준과 검정 반복 횟수가 있을 때 매 검정에서의 유의 수준을 (전체 유의 수준) / (검정 반복 횟수) 값을 기준으로 가설 검정을 진행
  • 튜키 검정: 본페로니 교정에서 검정력이 낮은 단점을 보완한 방법(https://rfriend.tistory.com/132)
  • 던넷 검정: 대조군과의 비교에만 관심이 있는 경우에 유용(https://en.wikipedia.org/wiki/Dunnett%27s_test#Formal_description_of_Dunnett's_test)
  • 윌리엄스 검정: 집단 간에 순위를 매길 수 있는 경우에 유용

위 네 가지 검정 방법은 사실 분산 분석 과정이 없어도 진행할 수 있습니다. F 분포를 사용한 분산 분석의 결과는 다중 비교 결과와도 일치하지만 F 분포를 사용하지 않은 분산 분석이라면 다중 비교에서는 결과가 다르게 나올 수도 있기 때문입니다.

비모수 검정의 평균값 비교

각 집단에 정규성이 없다면 비모수 검정 방식을 사용하는 것을 권장하고 있습니다. 이 때는 평균값 말고 데이터 분포의 위치를 나타내는 대푯값에 주목해서 해석합니다. 대표적으로는 윌콕슨 순위합 검정이 있는데 이는 각 데이터 값의 순위에 기반해 검정을 실시합니다.(https://blog.naver.com/gksshdk8003/222941192606)

맨-휘트니 U 검정도 윌콕슨 순위합 검정과 같은 방식으로 진행됩니다.(https://blog.naver.com/istech7/50152096673) 이 검정 방법은 비교하는 두 집단의 분포 모양 자체가 같아야 합니다.

이 외로도 플리그너-폴리셀로 검정(https://m.blog.naver.com/kwanskim/20195303483)과 브루너-문첼 검정(https://en.wikipedia.org/wiki/Brunner_Munzel_Test) 등이 있습니다.

 

집단에 3개 이상이면 분산 분석 대신 크러스컬-월리스 검정(https://3months.tistory.com/130)을 사용할 수 있습니다. 모수 검정의 튜키 검정, 던넷 검정 등에 대응하는 다중 비교 방법으로 스틸-드와스 검정스틸 검정 등이 있습니다.

728x90

'개념 정리 > 통계' 카테고리의 다른 글

비율을 비교하는 여러가지 방법  (2) 2024.01.25
진실과 판단의 4가지 패턴  (1) 2024.01.04
가설 검정 시행  (1) 2024.01.01
가설 검정의 원리  (1) 2023.10.27
표본 오차와 신뢰 구간  (1) 2023.10.19