조건부 확률
조건부 확률(conditional probability)은 어떤 사건이 일어나는 경우에 다른 사건이 일어날 확률을 말합니다.
" 오늘 비가 오면 내일 비가 올 확률"
오늘 비가 오면 내일 비가 올 확률이 당연히 올라가겠죠? 이렇게 사건 B(오늘 비가 올 확률)가 일어나는 경우에 사건 A(내일 비가 올 확률)을 "B에 대한 A의 조건부 확률"이라고 하고 \( P(A|B) \)로 표기합니다. \( P(A|B) \)와 \( P(B|A) \)는 같지 않음을 명심해야 합니다.
집합 \( S \)는 표본 공간일 때, 조건부 확률을 다음과 같이 구합니다.
\( P(A|B) = \frac {P(A \cap B)} {P(B)} = \frac {\frac {n(A \cap B )} {n(S)} } {\frac {n(B)} {n(S)}} = \frac {n(A \cap B)} {n(B)}\)
식으로 보니까 복잡해 보이죠? 하지만 예시를 들면 어렵지 않습니다.
한 개의 주사위를 던져서 홀수의 눈이 나왔을 때, 그 눈이 3의 배수일 확률?
- 홀수의 눈이 나오는 사건을 \(Y \), 3의 배수가 나오는 사건을 \( X \)로 가정
- \( P(Y) \)는 홀수의 눈이 나올 확률이므로 \( \frac {3} {6} \)
- \( P(X \cap Y ) \)는 홀수이면서, 3의 배수가 나올 확률이므로 \( \frac {1} {6} \)
\( P(X|Y) = \frac {P(X \cap Y)} {P(Y)} = \frac {\frac {1}{6}} {\frac {3}{6}} = \frac {1} {3} \)
이제 배울 분포들은 조건부 확률을 알아야 하므로 간단하게 설명하였습니다.
아래의 확률 질량 함수와, 확률 밀도 함수도 꼭 알아야 합니다. 기억이 안 나신다면 한번 보고 오시는 것을 추천드립니다!
결합 확률분포
결합 확률분포(Joint probability distribution)는 말 그대로, 두 개 이상의 사건이 동시에 일어날 확률에 대한 분포를 이야기합니다. 아래와 같이 표현할 수 있습니다.
\( P(X, Y) = P(X \cap Y) = P(X) * P(Y) \)
결합 확률이 되기 위해서는 조건이 필요합니다.
- 반드시 두 사건 X와 Y는 동시에 일어나야 합니다. (두 개의 주사위를 동시에 던지는 경우)
- 두 사건 X와 Y가 서로 독립(independent)이면 아래의 식이 성립합니다.
- \( P(X, Y) = P(X \cap Y) = P(X) * P(Y) \)
결합 확률 질량 함수(Joint Probability Mass Function)
이산 확률변수가 두 개 이상인 확률 질량 함수를 말합니다. 두 이산 확률변수 X, Y가 있습니다. 이 두 변수의 정의역은 \( x_1, x_2,..., x_m \)과 \( y_1, y_2, ..., y_n \)라고 가정해봅시다. 그럼 두 사건이 동시에 발생할 확률의 함수는 아래와 같이 표현할 수 있습니다.
\( P(X = x_i, Y = y_j) = p_{ij}(i = 1, 2, ..., m, j = 1, 2,..., n ) \)
두 이산 확률변수 X, Y에 대한 결합 확률의 합은 1입니다. 다음과 같이 나타낼 수 있습니다.
\( \sum_i \sum_j P(X = x_i, Y = y_j) = 1 \)
이산 확률변수가 n 개라면 \( X_1, X_2,...., X_n \)로 표현이 가능하고, 다음과 같이 나타내 집니다.
\( P_{X_{1},..., X_{n}} (x_1,..., x_n) = P(X_1 = x_1, ..., X_n = x_n) \)
\( \sum_i \sum_j... \sum_k P(X_1 = x_{1i}, X_2 = x_{2j},..., X_n = x_{nk}) = 1 \)
확률 분야에서 두 개 이상의 결합을 나타낼 때는 콤마(,)를 사용합니다.
예를 들어, 뽑기를 한다고 가정해봅시다. 뽑기에는 1등 1명, 2등 2명, 3등 3명이 있습니다. 뽑기를 2번 하는데, 저희는 1, 2등을 뽑고 싶어 한다고 가정해봅시다(설마 3등을 뽑고 싶은 사람은 없겠죠??..). 1등을 뽑은 개수를 확률변수 X, 2등을 뽑은 개수를 확률변수 Y로 설정해봅니다. X와 Y의 순서쌍은 (0, 0), (0, 1), (0, 2), (1, 0), (1, 1) 총 5개가 나옵니다. 각각에 대한 확률을 구해봅시다.
- 1등 0개, 2등 0개, (3등 2개)를 뽑는 경우의 확률
- \( p(0, 0) = \frac {_{3}\mathrm {C}_{2}} { _{6}\mathrm {C}_{2}} = \frac {2} {10} \)
- 1등 0개, 2등 1개, (3등 1개)를 뽑는 경우의 확률
- \( p(0, 1) = \frac {_{2}\mathrm {C}_{1} * _{3}\mathrm {C}_{1}} { _{6}\mathrm {C}_{2}} = \frac {4} {10} \)
- 1등 0개, 2등 2개, (3등 0개)를 뽑는 경우의 확률
- \( p(0, 2) = \frac {_{2}\mathrm {C}_{2}} { _{6}\mathrm {C}_{2}} = \frac {1} {15} \)
- 1등 1개, 2등 0개, (3등 1개)를 뽑는 경우의 확률
- \( p(1, 0) = \frac {_{1}\mathrm {C}_{1} * _{3}\mathrm{C}_{1}} { _{6}\mathrm {C}_{2}} = \frac {2} {10} \)
- 1등 1개, 2등 1개, (3등 0개)를 뽑는 경우의 확률
- \( p(1, 1) = \frac {_{1}\mathrm{C}_{1} * _{2}\mathrm {C}_{1}} { _{6}\mathrm {C}_{2}} = \frac {2} {15}\)
결합 확률분포표
\( \frac {x} {y} \) | 0 | 1 | 2 |
0 | \( \frac{2} {10} \) | \( \frac{4} {10} \) | \( \frac{1} {15} \) |
1 | \( \frac{2} {10} \) | \( \frac{2} {15} \) | 0 |
2 | 0 | 0 | 0 |
결합 확률 밀도 함수(Joint Probability Density Function)
두 개 이상의 확률 밀도 함수를 말합니다. 두 개의 연속 확률변수 X, Y가 있으면, 결합 확률 밀도 함수는 \( f_{X, Y}(x, y) \)로 나타낼 수 있습니다. 특정한 공간 A가 있을 시(연속 확률변수는 \(P (x) \)로 표현이 불가능하기 때문에 특정 공간이 지정되어야 함) 그 공간의 확률 값은 아래와 같은 식이 나옵니다.
\( P[(X, Y) \in A ] = \int \int_A f_{X, Y} (x, y) dxdy \)
결합 확률 밀도함 수은 확률변수가 없으므로, 모든 공간에 적분 값을 구하면 1이 됩니다.
\( \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f_{X, Y}(x, y) dxdy = 1 \)
예를 들어 대한민국 성인의 키를 연속 확률변수 X, 몸무게를 연속 확률변수 Y로 둡시다. 키와 몸무게는 실수이죠? 그러므로 연속 확률변수의 함수인 확률 밀도 함수로 표현이 되고, 두 개 이상이기 때문에 결합 확률 밀도 함수로 표현이 됩니다.
키가 170~180, 몸무게가 60~70인 확률 값을 구해봅시다. 위의 식에 정적분 범위만 정해주면 아래와 같은 식이 나옵니다.
\(P(170 \le X \le 180, 60 \le Y \le 70) = \int_{60}^{70} \int_{170}^{180} f_{X, Y}(x, y) dxdy \)
하지만 키와 몸무게는 완전히 독립적이라고 볼 수 없습니다. 하지만 독립인 경우에는 아래의 식이 성립합니다.
\(P(170 \le X \le 180, 60 \le Y \le 70) = P(170 \le X \le 180) P(60 \le Y \le 70) \)
참조
'통계' 카테고리의 다른 글
[통계] 결합엔트로피, 조건부엔트로피 (0) | 2022.11.15 |
---|---|
[통계] 조건부확률질량함수, 조건부확률밀도함수 (0) | 2022.11.15 |
[통계] 주변확률질량함수, 주변확률밀도함수 (0) | 2022.11.15 |
[통계] 확률질량함수와 확률밀도함수 (0) | 2022.11.14 |
[통계] 정보량과 엔트로피 (0) | 2022.11.14 |
댓글