통계 - 가설검정
📚 가설검정과 신뢰구간
1. 가설의 종류
귀무가설(Null Hypothesis, $H_0$)
변화, 차이, 효과가 “없다”는 기존의 주장.
예: 신약의 효과가 기존 약과 같다.대립가설(Alternative Hypothesis, $H_1$)
변화, 차이, 효과가 “있다”는 주장.
예: 신약의 효과가 기존 약과 다르다.
2. 기각역(Critical Region)
- 기각역
검정통계량(Z값 등)이 이 영역에 들어가면
귀무가설이 맞다고 보기 어려우므로 “기각”하는 영역.
3. 검정의 종류와 기각역 구조
3.1 좌측검정 (Left-tailed test)
- 예시:
$H_0: \mu \geq 100$
$H_1: \mu < 100$ - 기각역:
왼쪽 5% ($\alpha=0.05$)
[기각역 5%] |----------------------|
3.2 우측검정 (Right-tailed test)
- 예시:
$H_0: \mu \leq 100$
$H_1: \mu > 100$ - 기각역:
오른쪽 5% ($\alpha=0.05$)
|----------------------| [기각역 5%]
3.3 양측검정 (Two-tailed test)
- 예시:
$H_0: \mu = 100$
$H_1: \mu \neq 100$ - 기각역:
양쪽 각각 2.5% ($\alpha=0.05$)
[기각역 2.5%] |------------| [기각역 2.5%]
4. 임계치, Z변환, p-value
임계치(Critical Value)
검정통계량이 이 값을 넘으면 기각
(예: $\alpha=0.05$ → $Z \approx \pm1.645$ (단측), $Z \approx \pm1.96$ (양측))p-value(유의확률)
실제로 나온 결과 이상으로 극단적인 값이 관측될 확률 (귀무가설 하에서)
$p$-value < $\alpha$ 이면 기각
5. 모비율의 신뢰구간
표본에서 관찰된 비율($\hat{p}$)을 바탕으로,
모집단의 진짜 비율($p$)이 포함될 범위를 추정합니다.
신뢰수준 (Confidence Level)
신뢰구간이 모수를 포함할 확률 (예: 95%)유의수준 ($\alpha$)
$1 -$ 신뢰수준 (예: 95% → $\alpha=0.05$)임계값 (Z값, Critical Value)
신뢰수준에 따라 표준정규분포에서 결정 (95% → $Z=1.96$)
공식 (95% 신뢰수준)
\[\hat{p} \pm Z \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]- $\hat{p}$ : 표본비율 ($x/n$)
- $n$ : 표본 크기
- $Z$ : 신뢰수준에 따른 값 (95% → 1.96)
예시
100명 중 60명 성공 ($\hat{p} = 0.6$), $n = 100$, $Z = 1.96$
계산 과정
표본비율 : $\hat{p} = 0.6$
표준오차(SE) : $\sqrt{\frac{0.6 \times 0.4}{100}} = 0.049$
임계값 적용 : $1.96 \times 0.049 \approx 0.096$
따라서,
- 신뢰구간 하한(왼쪽 끝)
$0.6 - 0.096 = 0.504$ - 신뢰구간 상한(오른쪽 끝)
$0.6 + 0.096 = 0.696$
최종 신뢰구간
(0.504, 0.696)
6. 오류의 종류
1종 오류(Type I error, α)
실제로는 참인 귀무가설 H₀를 잘못 기각하는 오류 (False Positive)2종 오류(Type II error, β)
실제로는 거짓인 귀무가설 H₀를 기각하지 못하는 오류 (False Negative)
7. 검정력(Power)
가설검정에서 단순히 유의확률(p-value)만 확인하는 건 부족하다.
실제로 효과가 있을 때, 그 효과를 통계적으로 감지할 수 있는 능력,
바로 검정력(Power)이 중요하다.
검정력(Power)은 다음과 같이 정의된다:
- 검정력 = 귀무가설이 거짓일 때, 그것을 올바르게 기각할 확률
- 수식으로는: $1 - \beta$
여기서 $\beta$는 2종 오류(Type II error)의 확률을 의미한다.
예제: 신약의 혈압 감소 효과 검정
어떤 신약이 혈압을 낮춘다고 주장하고 있다. 이를 통계적으로 검정하기 위해 다음과 같은 조건에서 실험을 진행한다:
- 기존 평균 혈압: $\mu_0 = 120$ mmHg
- 신약 복용 후 기대 평균: $\mu_1 = 115$ mmHg
- 표준편차: $\sigma = 10$ mmHg
- 표본 수: $n = 25$
- 유의수준: $\alpha = 0.05$
- 단측검정 (왼쪽 꼬리 검정)
Step 1: 기각 기준 계산
유의수준 $\alpha = 0.05$인 단측검정의 임계 Z값은:
\[z_\alpha = -1.645\]이를 실제 평균 기준으로 변환하면, 귀무가설의 기각 기준값 $X_c$는:
\[X_c = \mu_0 + z_\alpha \cdot \frac{\sigma}{\sqrt{n}} = 120 - 1.645 \cdot \frac{10}{\sqrt{25}} = 116.71\]즉, 표본 평균이 116.71보다 작으면 귀무가설을 기각한다.
Step 2: 대립가설 하에서 기각 확률 계산
실제로 신약의 효과가 있어 평균이 $\mu_1 = 115$라고 할 때,
귀무가설의 기각 기준 $X_c = 116.71$보다 작을 확률은 다음과 같다:
따라서 이 검정의 검정력(Power)는 약 0.80,
즉 실제로 효과가 있을 경우 80% 확률로 그것을 감지할 수 있는 실험 설계라는 의미다.