수학 공식 | 고등학교 > 표본비율의 분포와 모비율의 추정

모비율과 표본비율

  1. 모집단에서 어떤 특성을 갖는 사건에 대한 비율을 고려할 때, 그 비율을 그 사건에 대한 모비율이라 하고, 기호로 $ p $와 같이 나타낸다.
  2. 모집단에서 임의추출한 표본에서 어떤 특성을 갖는 사건에 대한 비율을 고려할 때, 그 비율을 그 사건에 대한 표본비율이라 하고, 기호로 $ \hat{p} $와 같이 나타낸다.
  3. 크기가 $ n $인 표본에서 어떤 특성을 갖는 사건이 일어난 횟수를 확률변수 $ X $라 하면, 그 사건에 대한 표본비율 $ \hat{p} $은
    \begin{gather*}
    \hat{p} = \frac{X}{n}
    \end{gather*}
  • $ p $는 proportion의 첫글자이다.
  • $ \hat{p} $은 피햇으로 읽는다.

표본비율의 평균, 분산, 표준편차

모비율이 $ p $인 모집단에서 임의추출한 크기가 $ n $인 표본의 표본비율을 $ \hat{p} $라 할 때, 표본비율 $ \hat{p} $의 평균, 분산, 표준편차는 다음과 같다. (단, $ q=1-p $)

  1. $ {E(\hat{p})=p} $
  2. $ {V(\hat{p})}=\dfrac{pq}{n} $
  3. $ {\sigma(\hat{p})}=\sqrt{\dfrac{pq}{n}} $

$ \hat{p} = \dfrac{X}{n} $에서 확률변수 $ X $는 이항분포 $ B(n, \ p) $를 따르고

\begin{gather*}
E(X) = np, \ \ V(X) = npq \ (q = 1-p)
\end{gather*}

이다. 이때 표본비율 $ \hat{p} $의 평균과 분산을 구하면 다음과 같다.

\begin{align*}
E( \hat{p} ) &= E \left( \frac{X}{n} \right) = \frac{1}{n} E(X) = \frac{1}{n} \times np = p \\
V( \hat{p} ) &= V \left( \frac{X}{n} \right) = \frac{1}{n^2} V(X) = \frac{1}{n^2} \times npq = \frac{pq}{n}
\end{align*}

표본비율의 분포

모비율이 $ p $인 모집단에서 임의추출한 크기가 $ n $인 표본의 표본비율 $ \hat{p} $은 표본의 크기 $ n $이 충분히 크면 근사적으로 정규분포

\begin{gather*}
N \left( p, \ \frac{pq}{n} \right)
\end{gather*}

를 따른다. (단, $ q=1-p $)

모비율의 신뢰구간

표본비율이 $ \hat{p} $일 때, 표본의 크기 $ n $이 충분이 크면 모비율 $ p $의 신뢰구간은 다음과 같다. (단, $ \hat{q}=1-\hat{p} $)

  1. 신뢰도 95%의 신뢰구간
    \begin{gather*}
    \hat{p} - 1.96 \sqrt{\frac{\hat{p}\hat{q}}{n}} \leq p \leq \hat{p} + 1.96 \sqrt{\frac{\hat{p}\hat{q}}{n}}
    \end{gather*}
  2. 신뢰도 99%의 신뢰구간
    \begin{gather*}
    \hat{p} - 2.58 \sqrt{\frac{\hat{p}\hat{q}}{n}} \leq p \leq \hat{p} + 2.58 \sqrt{\frac{\hat{p}\hat{q}}{n}}
    \end{gather*}