Post

통계 - 가설검정

통계 - 가설검정

📚 가설검정과 신뢰구간


1. 가설의 종류

  • 귀무가설(Null Hypothesis, $H_0$)
    변화, 차이, 효과가 “없다”는 기존의 주장.
    예: 신약의 효과가 기존 약과 같다.

  • 대립가설(Alternative Hypothesis, $H_1$)
    변화, 차이, 효과가 “있다”는 주장.
    예: 신약의 효과가 기존 약과 다르다.


2. 기각역(Critical Region)

  • 기각역
    검정통계량(Z값 등)이 이 영역에 들어가면
    귀무가설이 맞다고 보기 어려우므로 “기각”하는 영역.

3. 검정의 종류와 기각역 구조

3.1 좌측검정 (Left-tailed test)

  • 예시:
    $H_0: \mu \geq 100$
    $H_1: \mu < 100$
  • 기각역:
    왼쪽 5% ($\alpha=0.05$)
    [기각역 5%] |----------------------|

3.2 우측검정 (Right-tailed test)

  • 예시:
    $H_0: \mu \leq 100$
    $H_1: \mu > 100$
  • 기각역:
    오른쪽 5% ($\alpha=0.05$)
    |----------------------| [기각역 5%]

3.3 양측검정 (Two-tailed test)

  • 예시:
    $H_0: \mu = 100$
    $H_1: \mu \neq 100$
  • 기각역:
    양쪽 각각 2.5% ($\alpha=0.05$)
    [기각역 2.5%] |------------| [기각역 2.5%]

4. 임계치, Z변환, p-value

  • 임계치(Critical Value)
    검정통계량이 이 값을 넘으면 기각
    (예: $\alpha=0.05$ → $Z \approx \pm1.645$ (단측), $Z \approx \pm1.96$ (양측))

  • p-value(유의확률)
    실제로 나온 결과 이상으로 극단적인 값이 관측될 확률 (귀무가설 하에서)
    $p$-value < $\alpha$ 이면 기각


5. 모비율의 신뢰구간

표본에서 관찰된 비율($\hat{p}$)을 바탕으로,
모집단의 진짜 비율($p$)이 포함될 범위를 추정합니다.

  • 신뢰수준 (Confidence Level)
    신뢰구간이 모수를 포함할 확률 (예: 95%)

  • 유의수준 ($\alpha$)
    $1 -$ 신뢰수준 (예: 95% → $\alpha=0.05$)

  • 임계값 (Z값, Critical Value)
    신뢰수준에 따라 표준정규분포에서 결정 (95% → $Z=1.96$)


공식 (95% 신뢰수준)

\[\hat{p} \pm Z \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]
  • $\hat{p}$ : 표본비율 ($x/n$)
  • $n$ : 표본 크기
  • $Z$ : 신뢰수준에 따른 값 (95% → 1.96)

예시

100명 중 60명 성공 ($\hat{p} = 0.6$), $n = 100$, $Z = 1.96$

계산 과정
표본비율 : $\hat{p} = 0.6$
표준오차(SE) : $\sqrt{\frac{0.6 \times 0.4}{100}} = 0.049$
임계값 적용 : $1.96 \times 0.049 \approx 0.096$

따라서,

  • 신뢰구간 하한(왼쪽 끝)
    $0.6 - 0.096 = 0.504$
  • 신뢰구간 상한(오른쪽 끝)
    $0.6 + 0.096 = 0.696$

최종 신뢰구간
(0.504, 0.696)


6. 오류의 종류

  • 1종 오류(Type I error, α)
    실제로는 참인 귀무가설 H₀를 잘못 기각하는 오류 (False Positive)

  • 2종 오류(Type II error, β)
    실제로는 거짓인 귀무가설 H₀를 기각하지 못하는 오류 (False Negative)


7. 검정력(Power)

가설검정에서 단순히 유의확률(p-value)만 확인하는 건 부족하다.
실제로 효과가 있을 때, 그 효과를 통계적으로 감지할 수 있는 능력,
바로 검정력(Power)이 중요하다.

검정력(Power)은 다음과 같이 정의된다:

  • 검정력 = 귀무가설이 거짓일 때, 그것을 올바르게 기각할 확률
  • 수식으로는: $1 - \beta$

여기서 $\beta$는 2종 오류(Type II error)의 확률을 의미한다.


예제: 신약의 혈압 감소 효과 검정

어떤 신약이 혈압을 낮춘다고 주장하고 있다. 이를 통계적으로 검정하기 위해 다음과 같은 조건에서 실험을 진행한다:

  • 기존 평균 혈압: $\mu_0 = 120$ mmHg
  • 신약 복용 후 기대 평균: $\mu_1 = 115$ mmHg
  • 표준편차: $\sigma = 10$ mmHg
  • 표본 수: $n = 25$
  • 유의수준: $\alpha = 0.05$
  • 단측검정 (왼쪽 꼬리 검정)

Step 1: 기각 기준 계산

유의수준 $\alpha = 0.05$인 단측검정의 임계 Z값은:

\[z_\alpha = -1.645\]

이를 실제 평균 기준으로 변환하면, 귀무가설의 기각 기준값 $X_c$는:

\[X_c = \mu_0 + z_\alpha \cdot \frac{\sigma}{\sqrt{n}} = 120 - 1.645 \cdot \frac{10}{\sqrt{25}} = 116.71\]

즉, 표본 평균이 116.71보다 작으면 귀무가설을 기각한다.

Step 2: 대립가설 하에서 기각 확률 계산

실제로 신약의 효과가 있어 평균이 $\mu_1 = 115$라고 할 때,
귀무가설의 기각 기준 $X_c = 116.71$보다 작을 확률은 다음과 같다:

\[Z = \frac{X_c - \mu_1}{\sigma / \sqrt{n}} = \frac{116.71 - 115}{10/\sqrt{25}} = \frac{1.71}{2} = 0.855\] \[P(Z < 0.855) \approx 0.80\]

따라서 이 검정의 검정력(Power)는 약 0.80,
실제로 효과가 있을 경우 80% 확률로 그것을 감지할 수 있는 실험 설계라는 의미다.


This post is licensed under CC BY 4.0 by the author.

Trending Tags