주변확률분포
주변확률분포는 결합확률분포를 전제로 합니다. 아래의 글을 보고 오시는 것을 추천합니다!
https://lcyking.tistory.com/118
결합확률분포에서 확률변수 X, Y의 결합확률분포 \( P_{x, y}(x, y) \)를 통해 하나의 확률변수에 대한 확률함수를 구할 수 있습니다. 근데 이는 주변확률분포로도 구할 수 있습니다. 하지만 오직 한가지 확률변수의 확률함수만 알고 싶은 경우가 있습니다. 만약 X의 확률함수만 알고 싶은 상황이면 Y에 대한 정보가 필요가 없겠죠? X, Y 두 개의 확률변수로 이루어진 결합확률분포를 X 또는 Y 하나의 확률 변수로 표현하는 것이 주변확률분포라고합니다.
주변확률질량함수(Marginal PMF)와 주변확률밀도함수(Marginal PMF)
주변확률질량함수
질량함수이므로 이산확률변수 X, Y가 있다고 가정합시다. 그럼 아래와 같은 식이 나옵니다.
\( p_x(x) = \sum_{ally}p(x, y) \)
\( p_y(y) = \sum_{allx}p(x, y) \)
각각 X에 대한 주변확률질량함수와 Y에 대한 주변확률질량함수입니다.
주변확률밀도함수
\( f_X (x) = \int_{-\infty}^{\infty} f(x, y)dy \)
\( f_Y (y) = \int_{-\infty}^{\infty} f(x, y)dx \)
만약 X의 함수를 구한다고 가정했을 시, 모든 Y의 확률을 더해주면 순수 X의 함수가 나올 것입니다.
주변확률질량함수를 구하는 예시를 들어보겠습니다.
아래와 같은 이산확률변수 X, Y의 결합분포표가 있다고 가정합시다.
\( \frac {x} {y} \) | 0 | 1 | 2 |
0 | \( \frac{2} {10} \) | \( \frac{4} {10} \) | \( \frac{1} {15} \) |
1 | \( \frac{2} {10} \) | \( \frac{2} {15} \) | 0 |
2 | 0 | 0 | 0 |
X가 0일 확률을 구한다고 가정해봅시다. 어떻게 할까요?? 간단합니다.
\( \sum_{i=0}^{2} p(0, i) = p(0, 0) + p(0, 1) + p(0, 2) \)
간단하죠?? 이제 \( p_y (y) \)의 열 하나, \( p_x (x) \)의 행 하나를 추가하여 표를 다시 나타내보겠습니다.
\( \frac {x} {y} \) | 0 | 1 | 2 | \(p_Y (y) \) |
0 | \( \frac{2} {10} \) | \( \frac{4} {10} \) | \( \frac{1} {15} \) | \( \frac{6+12+2} {30} = \frac{20} {30} \) |
1 | \( \frac{2} {10} \) | \( \frac{2} {15} \) | 0 | \( \frac{6+4} {30} = \frac{10} {30} \) |
2 | 0 | 0 | 0 | 0 |
\(p_X (x) \) | \( \frac{ 6 + 6 } {10} = \frac{ 12} {30} \) | \( \frac{12+4} {30} = \frac{16} {30} \) | \( \frac{2} {30} \) |
\( p_X(x) \) 의 모든 확률의 합과, \( p_Y(y) \) 의 모든 확률의 합을 구하면 각각 1이 나오는 것을 확인할 수 있습니다.
\( \sum_{i=0}^2 p_i(x) = 1\)
\( \sum_{i=0}^2 p_i(y) = 1\)
'통계' 카테고리의 다른 글
[통계] 결합엔트로피, 조건부엔트로피 (0) | 2022.11.15 |
---|---|
[통계] 조건부확률질량함수, 조건부확률밀도함수 (0) | 2022.11.15 |
[통계] 결합확률질량함수, 결합확률밀도함수 (0) | 2022.11.14 |
[통계] 확률질량함수와 확률밀도함수 (0) | 2022.11.14 |
[통계] 정보량과 엔트로피 (0) | 2022.11.14 |
댓글