본문 바로가기
통계

[통계] 주변확률질량함수, 주변확률밀도함수

by PIAI 2022. 11. 15.

주변확률분포

 

주변확률분포는 결합확률분포를 전제로 합니다. 아래의 글을 보고 오시는 것을 추천합니다!

https://lcyking.tistory.com/118

 

결합확률분포에서 확률변수 X, Y의 결합확률분포 \( P_{x, y}(x, y) \)를 통해 하나의 확률변수에 대한 확률함수를 구할 수 있습니다. 근데 이는 주변확률분포로도 구할 수 있습니다. 하지만 오직 한가지 확률변수의 확률함수만 알고 싶은 경우가 있습니다. 만약 X의 확률함수만 알고 싶은 상황이면 Y에 대한 정보가 필요가 없겠죠? X, Y 두 개의 확률변수로 이루어진 결합확률분포를 X 또는 Y 하나의 확률 변수로 표현하는 것이 주변확률분포라고합니다.

 

주변확률질량함수(Marginal PMF)와 주변확률밀도함수(Marginal PMF)

 

주변확률질량함수

 

질량함수이므로 이산확률변수 X, Y가 있다고 가정합시다. 그럼 아래와 같은 식이 나옵니다.

 

\( p_x(x) = \sum_{ally}p(x, y) \)

\( p_y(y) = \sum_{allx}p(x, y) \)

 

각각 X에 대한 주변확률질량함수와 Y에 대한 주변확률질량함수입니다. 

 

주변확률밀도함수

\( f_X (x) = \int_{-\infty}^{\infty} f(x, y)dy \)

\( f_Y (y) = \int_{-\infty}^{\infty} f(x, y)dx \)

 

만약 X의 함수를 구한다고 가정했을 시, 모든 Y의 확률을 더해주면 순수 X의 함수가 나올 것입니다.

 

주변확률질량함수를 구하는 예시를 들어보겠습니다.

아래와 같은 이산확률변수 X, Y의 결합분포표가 있다고 가정합시다.

\( \frac {x} {y} \) 0 1 2
0 \( \frac{2} {10} \) \( \frac{4} {10} \) \( \frac{1} {15} \)
1 \( \frac{2} {10} \) \( \frac{2} {15} \) 0
2 0 0 0

X가 0일 확률을 구한다고 가정해봅시다. 어떻게 할까요?? 간단합니다.

 

\( \sum_{i=0}^{2} p(0, i) =  p(0, 0)  + p(0, 1) + p(0, 2)  \)

 

간단하죠?? 이제 \( p_y (y) \)의 열 하나, \( p_x (x) \)의 행 하나를 추가하여 표를 다시 나타내보겠습니다.

 

\( \frac {x} {y} \) 0 1 2 \(p_Y (y) \)
0 \( \frac{2} {10} \) \( \frac{4} {10} \) \( \frac{1} {15} \) \( \frac{6+12+2} {30} = \frac{20} {30} \)
1 \( \frac{2} {10} \) \( \frac{2} {15} \) 0 \( \frac{6+4} {30} = \frac{10} {30} \)
2 0 0 0 0
\(p_X (x) \) \( \frac{ 6 + 6 } {10} = \frac{ 12} {30} \) \( \frac{12+4} {30} = \frac{16} {30} \) \( \frac{2} {30} \)  

 

\( p_X(x) \) 의 모든 확률의 합과, \( p_Y(y) \) 의 모든 확률의 합을 구하면 각각 1이 나오는 것을 확인할 수 있습니다.

 

\( \sum_{i=0}^2 p_i(x) = 1\)

\( \sum_{i=0}^2 p_i(y) = 1\)

댓글