<통계학 : 파이썬을 이용한 분석> 책 내용 중 '5장. 확률' 부분을 요약하였고, 필요한 내용은 더 추가한 글임을 미리 밝힙니다.
5. 확률
5-2. 사건의 확률
- 사건의 확률
- 그 사건이 일어날 가능성의 정도를 나타내 주는 수치
- 동일한 조건에서 실험을 반복할 때 전체 실험 횟수에서 그 사건이 일어날 것이라 예상되는 횟수의 비율
- 사건 $A$의 확률은 $P(A)$로 표현
- 개념
- 표본공간(sample space: $Ω$): 한 실험에서 나올 수 있는 모든 결과들의 모임
- 근원사건(elementary outcomes: $w_1, w_2, \cdots$) 표본공간을 구성하는 개개의 결과
- 사건(event: $A, B, \cdots$): 표본공간의 부분집합으로 어떤 특성을 갖는 결과들의 모임(즉, 근원사건들의 집합)
- 표본 공간은 유한할 수도, 무한할 수도 있음. 표본공간의 원소가 연속체(continuum)로 주어져 나열할 수 없는 경우를 연속표본공간(continuous sample space)이라고 함.
- 확률의 법칙
- (1) 모든 사건 $A$에 대하여 $0≤P(A)≤1$
- (2) $P(A)=\sum_{w_1\in A}P(w_i)$
- (3) $P(Ω)=\sum_{w_1\in Ω}P(w_i)$
5.3 확률의 계산
- 규칙 1(균일 확률)
- 표본공간 $Ω$가 $k$개의 원소로 이루어져 있고 각 근원사건이 일어날 가능성이 동일(equally likely)할 때, 근원사건 하나가 일어날 확률은 $1/k$
- 사건 A가 m개의 근원사건으로 이루어져 있다면 $P(A) = \frac{m}{k}=\frac{A에 속하는 근원사건의 개수}{Ω에 속하는 근원사건의 개수}$
- 규칙 2(상대도수 수렴치로서의 확률)
- 동일한 실험을 $N$회 반복할 때 사건 $A$의 상대도수
- $r_N(A)=\frac{N번의 시행 중 A가 일어난 횟수}{N}$
- 여기에서 $N$이 증가함에 따라 상대도수가 일정한 값으로 수렴하면 그 값으로 $P(A)$를 추정
5.4 확률법칙
- 개념
- 여사건: $A$에 포함되지 않은 근원사건들의 모임. $A^C$
- 합사건: $A$ 또는 $B$에 포함되는 근원사건들의 모임. $A\cup B$
- 곱사건: $A$와 $B$에 동시에 포함되는 근원사건들의 모임. $A \cap B$
- 배반사건(disjoint event): 동시에 일어날 수 없는 사건
- 여사건의 확률법칙: $P(A^C)=1-P(A)$
- 드모르간의 법칙
- $(A\cap B)^C=A^C\cup B^C$
- $(A\cup B)^C=A^C\cap B^C$
- 차집합의 성질: $A-B=A\cap B^C$
- 합사건의 확률법칙
- 사건 $A$와 $B$가 배반사건이라면 $P(A \cap B)=P(∅)=0$
- $P(A\cup B)=P(A)+P(B)$가 됨
5.5 조건부확률과 독립성
- 조건부확률
- 사건 B에 관한 정보(사전정보: prior information)가 주어졌을 때 사건 A의 교정된 확률
- $P(A|B)=\frac{P(A\cap B)}{P(B)}(단, P(B)>0)$
- 곱사건의 확률법칙: $P(A\cap B)=P(A|B)\times P(B)$
- 독립
- 두 사건의 발생이 전혀 무관할 때
- $P(A\cap B)=P(A)P(B)$
- $P(A|B)=P(A)$ 사건 B의 발생 여부가 사건 A의 발생에 영향을 주지 않는다는 독립의 개념을 잘 설명해 줌
- 독립이면 $P(A\cap B)=P(A)P(B)$, 배반이면 $(A\cap B)=∅$이므로 $P(A\cap B)=0$이 됨
- 두 사건의 확률이 모두 양수라면 독립과 배반의 조건을 동시에 만족시킬 수 없음
- 표본공간의 분할(partition): 배반사건들의 모임
(https://www.youtube.com/watch?v=4zptP2UNdCE&t=121s 참고하여 작성)
- 총확률의 법칙(law of total probability)
- 곱사건의 확률법칙과 사건의 분할을 이용하여 임의의 사건의 확률을 표현한 것
- e) 어떤 공장의 제품이 30%는 A1공장, 50%는 A2공장, 20%는 A3공장에서 생산되며, 각 불량률이 2%, 1%, 5%일 때, 임의로 하나를 뽑았더니 불량일 확률 $P(B) = 0.021$
- 아래 그림에서 $B$ 부분의 확률을 구할 때 총확률법칙 사용
- 총확률의 법칙 증명
$$B=B\cap S$$
$$=B\cap(A_1\cup A_2\cup A_3\cup \cdots \cup A_k)$$
$$=(B\cap A_1)\cup (B\cap A_2)\cup \cdots \cup (B\cap A_k)$$
그런데 $(B\cap A_k)$끼리는 배반이므로,
$$P(B)=P[(B\cap A_1)\cup (B\cap A_2)\cup \cdots \cup (B\cap A_k)]$$
$$=P[(B\cap A_1)+(B\cap A_2)+\cdots+(B\cap A_k)]$$
$$= \sum_{i=1}^{k}P(B\cap A_i)$$
$$= \sum_{i=1}^{k}P(A_i)P(B|A_i)$$
- 베이즈 정리
- 어떤 사건의 발생 확률에 대한 선험적 생각이 실험에 의해 변화되는 체계적 과정을 표현
- e) 어떤 공장의 제품이 불량일 때 A1공장에서 만들어졌을 확률 $P(A_1|B) = 0.28571$
- 그림에서 전체 $B$를 알 때, $P(A_i|B)$(그림에서 색칠한 부분)를 추정할 때 사용
- 사건 $A_1, A_2, \cdots, A_n$이 표본공간의 분할일 때, 임의의 사건 $B$에 대하여 다음 식이 성립
$P(A_i|B)=\frac{P(A_i)P(B|A_i)}{P(A_1)P(B|A_1)+\cdots +P(A_n)P(B|A_n)}, i=1, \cdots, n$
'GIS > Statistics' 카테고리의 다른 글
[기초통계] 통계적 추론–표본의 크기가 클 때–(모평균의 추정, 모평균에 대한 검정, 모비율에 대한 추론) (1) | 2023.01.27 |
---|---|
[기초통계] 표집분포(계량의 확률분포, 표본평균의 분포와 중심극한정리) (0) | 2023.01.18 |
[기초통계] 정규분포(연속확률분포, 정규분포의 일반적인 성질 및 확률계산, 이항분포의 정규분포근사, 정규분포가정의 조사) (3) | 2023.01.17 |
[기초통계] 이항분포와 그에 관련된 분포들(베르누이 시행, 이항분포, 초기하분포, 포아송분포) (0) | 2023.01.16 |
[기초통계] 확률분포(확률변수, 이산확률변수와 확률분포, 확률분포의 기댓값과 표준편차, 두 확률변수의 결합분포, 공분산과 상관계수, 두 확률변수) (0) | 2023.01.11 |