본문 바로가기
GIS/Statistics

[기초통계] 표집분포(계량의 확률분포, 표본평균의 분포와 중심극한정리)

by lucky__lucy 2023. 1. 18.

<통계학 : 파이썬을 이용한 분석> 책 내용 중 '9장. 표집분포' 부분을 요약하였고, 필요한 내용은 더 추가한 글임을 미리 밝힙니다.

 

 

9. 표집분포

 

9.1 서론

- 개념
    - 모수(parameter): 수치로 표현되는 모집단의 특성
    - 통계량(statistic) 표본의 관측값들에 의하여 결정되는 양

 



9.2 통계량의 확률분포

- 개념
    - 표집분포(sampling distribution): 통계량의 확률분포
    - 임의표본(random sample): 크기가 큰 모집단으로부터 임의추출된 크기가 $n$인 표본 $X_1, \cdots, X_n$은 서로 독립이고 모두 모집단의 분포와 같은 분포를 갖는 것으로 간주함
        - $X_1, \cdots, X_n$를 임의표본으로 부름

 



9.3 표본평균의 분포와 중심극한정리

- 평균이 $\mu$ 분산이 $\sigma^2$인 모집단에서 표본 크기가 $n$인 표본을 추출했을 때, 표본평균 $\bar{X}$의 기댓값, 분산, 표준편차
    - $E(\bar{X})= \frac{1}{n}[E(X_1)+\cdots+E(X_n)]=\mu=(모집단의 기댓값)$
    - $Var(\bar{X})=\frac{1}{n^2}[Var(X_1)+\cdots+Var(X_n)]=\frac{\sigma^2}{n}=\frac{모집단의 표준편차}{\sqrt{표본의 크기}}$
    - $sd(\bar{X})=\sqrt{Var(\bar{X})}=\frac{\sigma}{\sqrt n}=(\frac{모집단의 표준편차}{\sqrt{표본의 크기}})$
- 정규모집단에서의 표본평균 $\bar{X}$의 분포는 정규분포임
    - 모평균이 $\mu$, 모표준편차가 $\sigma$인 정규모집단에서 $n$개의 표본을 임의로 추출할 때 그 표본의 평균 $\bar{X}$의 분포는 평균이 $\mu$, 표준편차는 $\sigma/\sqrt{n}$인 정규분포임
- 중심극한정리(central limit theorem)
    - 표본의 크기 $n$이 큰 경우, $\bar{X}$의 분포는 모집단의 분포와 무관하게 근사적으로 정규분포를 따르게 되는 것을 의미
    - 모집단의 평균이 $\mu$, 분산이 $\sigma^2$일 때, 임의추출된 표본의 표본평균 $\bar{X}$는 표본의 크기 $n$이 큰 경우(보통 30 이상) 근사적으로 정규분포를 따르게 되며 평균은 $\mu$이고, 표준편차는 $\sigma/\sqrt{n}$가 됨
        - $Z=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}$~$N(0, 1)$

매우 불규칙한 분포도 충분히 많은 수를 더하면 중심극한정리에 따라 결국 정규분포로 수렴함 (출처: https://ko.wikipedia.org/wiki/중심_극한_정리)

 

 
통계학: 파이썬을 이용한 분석
오늘날 통계학을 이용한 데이터 분석에서 통계소프트웨어의 사용은 거의 필수적이다. 파이썬(Python)을 이용하여 실습과 분석을 할 수 있도록 설명한 책이다. 파이썬은 빅데이터 처리에서 가장 많이 쓰이는 고급 프로그래밍 언어 중 하나로서 인터넷을 통해 무료로 또한, 지속적으로 새로운 함수 등이 업데이트되고 있어서 실제로 트렌디한 데이터 분석 및 여러 인공지능 관련 프로그래밍에서 필수적인 언어로 자리매김하는 중이다. 각 장 마지막 부분에는 파이썬을 이용한 예제를 제시하여 그 장에서 소개한 내용에 대한 예제를 따라하면서 언어와 분석 방법을 익힐 수 있도록 구성하였으며, 기본적인 파이썬에 대한 사용법은 부록에 수록하였다.
저자
인하대학교 통계학과
출판
자유아카데미
출판일
2022.06.25

 

728x90
반응형