교육 이론

통계적 추론과 가설검정

슈니첼 2023. 5. 26. 16:24
반응형

통계적 추론은 모집단에서 추출한 표본을 이용해 모집단에 대해 알고 싶은 특성을 추측하는 과정을 말한다. 학교에 걸어오는 학생 수를 알고싶다고 했을 때, 모집단은 전교생이고 대표로 A반을 조사한다면 A반 학생들이 표본이다. 모집단을 조사하기는 어려우므로 표본으로부터 정보를 얻고 이를 분석하여 모집단에 대한 결론을 이끌어낸다. 이런 모집단의 특성을 나타내는 수치를 모수라고 한다.

 

통계적 추론은 크게 모수에 대한 추정과 가설검정으로 나눌 수 있다. 모수의 추정은 모수에 대한 추측치를 수치화된 정확도와 함께 제시하는 것이다. 이 추정에는 점추정과 구간추정이 있다. 점추정은 모수를 하나의 값으로 제시하여 추측하는 것이고 구간추정은 모수를 포함할 것이라고 예상되는 구간을 제시하여 모수를 추측한다. 가설검정은 모수에 대한 두 가지 가설을 수립한 후 어떤 것이 옳은지 통계적으로 판단하는 것이다.

 

예를 들어 A학교 남학생 몸무게의 평균을 알고자 한다면 모집단은 A학교 남학생이고 몸무게 전체 평균이 모수이다. 모수를 구하기 위해 30명의 표본을 뽑아서 조사한 뒤 A학교 남학생 몸무게의 평균을 추론한다고 하면 3가지 방법이 가능하다.

 

  1. 점추정: 어떠한 값 하나로 모수를 추정
  2. 구간추정: 모수를 하나의 값이 아닌 범위로 추정
  3. 가설검정: 5년 전 A학교 남학생 몸무게 평균이 60kg이라고 했을 때 현재의 값과 같은지 다른지 자료를 바탕으로 판단

 

구간추정

구간추정에서 어떤 구간이 모수를 포함할 확률이 95%라고 하면 신뢰수준(신뢰도)가 95%라고 말한다. 같은 신뢰수준 내에서는 신뢰구간이 좁은 것이 좋다. ɑ는 모수가 신뢰구간 안에 포함되지 않을 확률이다. 그래서 모수가 신뢰구간 안에 포함될 확률인 신뢰수준은 1-ɑ라고 쓴다. 보통 이 ɑ 값으로 0.05를 많이 사용하는데, 이는 모수에 대한 95% 신뢰구간을 구하게 된다. 신뢰구간을 짧게 하려면 (1-ɑ)를 작게 하거나 n(표본수)을 많이 해야한다. 이때 z 값은 1.96이다. (99% 일때는 z: 2.58) 95% 신뢰구간의 의미는 표본을 여러번 추출하여 같은 방법으로 신뢰구간을 구할 때 이중 모수를 포함하는 구간의 비율이 95%에 가깝다는 것이다. 표본 추출을 100번 해서 100개의 서로 다른 신뢰구간을 구했을 때 모수를 포함하는 구간은 대략 95개 정도 나온다는 의미이다.

알파범위

 

표본의 크기가 충분히 크면 근사적으로 표준정규분포를 따른다고 할 수 있다. 표본의 크기가 작을 때에는 t-분포를 따른다. t-분포는 정규분포와 비슷한 모양이지만 대신 중심부는 정규분포보다 낮고 양쪽 고리는 좀 더 높다.

 

가설검정

모집단에 대해 어떤 두 가지 가설을 설정하고 표본을 분석해 둘 중 어떤 가설이 맞는지 타당성 여부를 결정하는 통계적 방법을 말한다. 몸무게를 줄이려면 탄수화물 섭취량을 줄이는 것이 효과적인지 판단하려고 한다. 실험 대상자는 40명, 탄수화물 섭취를 줄이기 전 몸무게 평균은 200kg, 표준편차 24라고 했을 때, 탄수화물 섭취를 1년간 줄인 후 측정한 몸무게 평균은 표본평균 (x바)이라 한다.

 

이 때 첫 번째 가설A는 '탄수화물 섭취량을 줄이는 것이 효과가 없다.' 인데, 이 가설이 성립하려면 1년 후 몸무게 평균도 200kg이 나와야 한다. 1년 후에 몸무게 평균이 줄었다면 '탄수화물 섭취량을 줄이는 것은 효과가 있다.' 라는 가설B가 성립한다. 하지만 1년 전 몸무게와 1년 후 몸무게 평균이 정확히 똑같기 어려울뿐더러 199kg로 값이 나왔다고 해도 표본의 불확실성 때문에 항상 효과적이라고(가설B가 맞다고) 말할 수는 없다. 그래서 가설B를 타당하다고 판단할만한 숫자값이 필요하고 이를 잘못 판단할 확률이 얼마정도(c)된다는 것을 함께 말해야 한다.

 

'효과가 없다'라는 가설A가 맞다면, 표본평균의 분포는 평균이 200이고 분산이 24^2/40인 정규분포를 따르게 된다. 이 때 가설A가 맞아도 잘못된 판단을 내릴 확률을 5%(=0.05)가 되게 하려면 표준정규분포표에서 p값이 0.05인 값=1.645를 만들 수 있는 c값을 계산해야된다. 이 값을 계산하면 193.76이 나오는데, 1년후 몸무게 평균이 193.76보다 작거나 같다면, 가설A가 타당하다고 판단할 수 있고, 효과가 없는데도 효과가 있다고(가설A가 틀린데도 가설A가 맞다고) 잘못 판단할 확률이 5%가 되는 것이다.

 

이 때 가설A와 가설B를 의미하는 용어는, 효과가 없다고 본 가설A는 귀무가설(H0)이고, 효과가 있다고 본 가설B는 대립가설(H1)이다. 효과가 있음을 입증하고 싶었기 때문에 효과가 있다는 가설이 대립가설이 된다. 귀무가설은 기각을 해야 대립가설이 옳다고 판단하게 된다.