수학 공식 | 고등학교 > 표본비율의 분포와 모비율의 추정
모비율과 표본비율
- 모집단에서 어떤 특성을 갖는 사건에 대한 비율을 고려할 때, 그 비율을 그 사건에 대한 모비율이라 하고, 기호로 $ p $와 같이 나타낸다.
- 모집단에서 임의추출한 표본에서 어떤 특성을 갖는 사건에 대한 비율을 고려할 때, 그 비율을 그 사건에 대한 표본비율이라 하고, 기호로 $ \hat{p} $와 같이 나타낸다.
- 크기가 $ n $인 표본에서 어떤 특성을 갖는 사건이 일어난 횟수를 확률변수 $ X $라 하면, 그 사건에 대한 표본비율 $ \hat{p} $은
\begin{gather*}
\hat{p} = \frac{X}{n}
\end{gather*}
- $ p $는 proportion의 첫글자이다.
- $ \hat{p} $은 피햇으로 읽는다.
표본비율의 평균, 분산, 표준편차
모비율이 $ p $인 모집단에서 임의추출한 크기가 $ n $인 표본의 표본비율을 $ \hat{p} $라 할 때, 표본비율 $ \hat{p} $의 평균, 분산, 표준편차는 다음과 같다. (단, $ q=1-p $)
- $ {E(\hat{p})=p} $
- $ {V(\hat{p})}=\dfrac{pq}{n} $
- $ {\sigma(\hat{p})}=\sqrt{\dfrac{pq}{n}} $
$ \hat{p} = \dfrac{X}{n} $에서 확률변수 $ X $는 이항분포 $ B(n, \ p) $를 따르고
\begin{gather*}
E(X) = np, \ \ V(X) = npq \ (q = 1-p)
\end{gather*}
이다. 이때 표본비율 $ \hat{p} $의 평균과 분산을 구하면 다음과 같다.
\begin{align*}
E( \hat{p} ) &= E \left( \frac{X}{n} \right) = \frac{1}{n} E(X) = \frac{1}{n} \times np = p \\
V( \hat{p} ) &= V \left( \frac{X}{n} \right) = \frac{1}{n^2} V(X) = \frac{1}{n^2} \times npq = \frac{pq}{n}
\end{align*}
표본비율의 분포
모비율이 $ p $인 모집단에서 임의추출한 크기가 $ n $인 표본의 표본비율 $ \hat{p} $은 표본의 크기 $ n $이 충분히 크면 근사적으로 정규분포
\begin{gather*}
N \left( p, \ \frac{pq}{n} \right)
\end{gather*}
를 따른다. (단, $ q=1-p $)
모비율의 신뢰구간
표본비율이 $ \hat{p} $일 때, 표본의 크기 $ n $이 충분이 크면 모비율 $ p $의 신뢰구간은 다음과 같다. (단, $ \hat{q}=1-\hat{p} $)
- 신뢰도 95%의 신뢰구간
\begin{gather*}
\hat{p} - 1.96 \sqrt{\frac{\hat{p}\hat{q}}{n}} \leq p \leq \hat{p} + 1.96 \sqrt{\frac{\hat{p}\hat{q}}{n}}
\end{gather*} - 신뢰도 99%의 신뢰구간
\begin{gather*}
\hat{p} - 2.58 \sqrt{\frac{\hat{p}\hat{q}}{n}} \leq p \leq \hat{p} + 2.58 \sqrt{\frac{\hat{p}\hat{q}}{n}}
\end{gather*}