<통계학 : 파이썬을 이용한 분석> 책 내용 중 '9장. 표집분포' 부분을 요약하였고, 필요한 내용은 더 추가한 글임을 미리 밝힙니다.
9. 표집분포
9.1 서론
- 개념
- 모수(parameter): 수치로 표현되는 모집단의 특성
- 통계량(statistic) 표본의 관측값들에 의하여 결정되는 양
9.2 통계량의 확률분포
- 개념
- 표집분포(sampling distribution): 통계량의 확률분포
- 임의표본(random sample): 크기가 큰 모집단으로부터 임의추출된 크기가 $n$인 표본 $X_1, \cdots, X_n$은 서로 독립이고 모두 모집단의 분포와 같은 분포를 갖는 것으로 간주함
- $X_1, \cdots, X_n$를 임의표본으로 부름
9.3 표본평균의 분포와 중심극한정리
- 평균이 $\mu$ 분산이 $\sigma^2$인 모집단에서 표본 크기가 $n$인 표본을 추출했을 때, 표본평균 $\bar{X}$의 기댓값, 분산, 표준편차
- $E(\bar{X})= \frac{1}{n}[E(X_1)+\cdots+E(X_n)]=\mu=(모집단의 기댓값)$
- $Var(\bar{X})=\frac{1}{n^2}[Var(X_1)+\cdots+Var(X_n)]=\frac{\sigma^2}{n}=\frac{모집단의 표준편차}{\sqrt{표본의 크기}}$
- $sd(\bar{X})=\sqrt{Var(\bar{X})}=\frac{\sigma}{\sqrt n}=(\frac{모집단의 표준편차}{\sqrt{표본의 크기}})$
- 정규모집단에서의 표본평균 $\bar{X}$의 분포는 정규분포임
- 모평균이 $\mu$, 모표준편차가 $\sigma$인 정규모집단에서 $n$개의 표본을 임의로 추출할 때 그 표본의 평균 $\bar{X}$의 분포는 평균이 $\mu$, 표준편차는 $\sigma/\sqrt{n}$인 정규분포임
- 중심극한정리(central limit theorem)
- 표본의 크기 $n$이 큰 경우, $\bar{X}$의 분포는 모집단의 분포와 무관하게 근사적으로 정규분포를 따르게 되는 것을 의미
- 모집단의 평균이 $\mu$, 분산이 $\sigma^2$일 때, 임의추출된 표본의 표본평균 $\bar{X}$는 표본의 크기 $n$이 큰 경우(보통 30 이상) 근사적으로 정규분포를 따르게 되며 평균은 $\mu$이고, 표준편차는 $\sigma/\sqrt{n}$가 됨
- $Z=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}$~$N(0, 1)$