본문 바로가기

Radiant

단일표본 가설검정 (One sample hypothesis test)

오늘은 Radiant 에서 단일표본일 때 가설검정을 어떻게 할 수 있는지 알아보자.

 

단일표본 가설검정은 비율 검정과 평균 검정 두 가지가 있는데, 모두 'basics' 에서 할 수 있다. 

1. one sample proportion test (모비율 가설검정) : basics -> single proportion (one population 일 때)

2. one sample mean test (모평균 가설검정) :  basics -> single mean

 

각각 예시를 통해 자세히 살펴보도록 하겠다.

 

1. 모비율 가설검정

아래의 예시는 '여성' 의 비율이 0.8 보다 작은지를 검정한 예시이다.

Test type : Binomial exact, Z-test 중 선택

 

노란색으로 하이라이트 한 부분에서 귀무가설과 대립가설을 확인할 수 있는데, 이 경우

귀무가설은 H0: p = 0.8, 대립가설은 Ha: p < 0.8 이며 이 때 기준이 되는 확률을 p0 라고 하자.

 

그러면 대립 가설 아래의 기호들은 다음과 같이 해석할 수 있다.

- p = 표본비율 (sample probability)

- ns = 성공 개수 (number of success) (이 경우, 여성의 수)

- n = 총 표본 개수 (number of trial)

- sd = 표본의 표준편차 (sample standard deviation)

- se = 표준오차 (sample error)  = sd / sqrt(n) = 표본평균의 표준편차 

- me = 오차범위 margin of error (CI 구할 때 필요)

- diff = p - p0 = 표본비율 - p0

- p-value 해석: 귀무가설이 맞을 때 (p = 0.8), 내 샘플 (0.73) 보다 더 작은 극단적인 값이 나올 확률이 <0.001 이다. 

 

 

귀무가설을 기각해야 하는지 여부는 아래쪽에 'p.value' 값을 확인하면 된다. 오늘쪽에 별 '*' 의 개수는 어떤 유의수준에서 유의한지 알려준다.

 

이 경우, p-value 는 0.001 보다 작으므로 귀무가설을 기각한다.

 

그런데, 여기에서는 정확한 p.value 나오지 않는다. 이런 경우, 정확한 값은 probabilty calculation 에서 계산할 수 있다!

예를 들어, 이 예시에서 

p = 0.8, X = # of women ~ Binomial(400, 0.8) => p-value = P(X<=292)

단, 값이 매우 작으므로 'Decimals' 을 조정하여 소수점 자리를 늘려야 한다.

 

비슷한 프로세스로 critical value (임계값: X = 몇 명까지 기각할 수 있는지)도 probability calculation 에서 구할 수 있다

 

 

2. 모평균 가설검정

 

평균검정은 test type 을 따로 고르지 않는다는 것 빼고 비율 검정과 비슷하다.

 

다른 점 몇 가지만 언급하도록 하겠다.

- H0: mu = 41.9

- Ha: mu =/ 41.9

- mean: 표본 평균 (xbar)

- t.value : t = diff / se = 0.981 (Rdiant 의 모평균 검정은 t-test 를 가정한다)

- df: n-1 (자유도 - 자유도가 있는 이유는 평균 검정은 t 분포를 기반으로 하기 때문이다.

모표준편차를 알 때는 CLT(중심극한정리)에 따라 정규분포를 사용할 수 있지만, 모표준편차를 모를 때는 t 분포로 test 를 해야 한다.)

- p-value 해석 : 귀무가설이 맞을 때, tail 쪽에 있을 확률이 34.2% 이다. 즉, 귀무가설이 맞을 때, 내 sample mean 보다 더 극단적인 값일 확률이 34.2%이다. 또는 귀무가설을 기각했는데 이 판단이 틀릴 확률이 34.2%이다.