Research/확률, 통계

주변확률질량함수와 주변확률밀도함수

bskyvision.com 2019. 3. 29. 12:31

주변확률질량함수(marginal probability mass function)는 이산확률변수와 관련된 것이고, 주변확률밀도함수(marginal probability density function)는 연속확률변수와 관련된 것이라는 것을 우리는 이름을 통해서 알 수 있다.

 

질량이 들어가면 이산, 밀도가 들어가면 연속!

 

주변확률질량함수와 주변확률밀도함수를 이해하기 위해서는 결합확률질량함수와 결합확률밀도함수를 선행적으로 공부해야한다. 그에 대한 포스팅은 링크를 참고하자. https://bskyvision.com/456

 

주변확률질량함수와 주변확률밀도함수

두 개 확률변수의 결합확률질량함수나 결합확률밀도함수가 주어진 상황에서 오직 한가지 확률변수의 확률함수만을 알고 싶은 경우가 있다. 이산확률변수 X, Y의 결합확률질량함수가 p(x, y)라고 하자. 이 결합확률질량함수로부터 알고 싶은 것이 오직 확률변수 X의 확률함수라면 Y에 대한 정보는 필요없게 된다. 마찬가지로 확률변수 Y의 확률함수만 알고 싶다면 X에 대한 정보는 필요없게 된다. 이때 수행하는 것이 marginalization이다. marginalization을 통해서 주변확률질량함수 또는 주변확률밀도함수를 구할 수 있다. 

 

이산확률변수 X, Y의 결합확률질량함수가 주어진 상황에서 X와 Y의 주변확률질량함수는 각각 다음과 같이 구한다. 

 

 

 

X에 대한 주변확률질량함수는 $p_X(x)$로, Y에 대한 주변확률질량함수는 $p_Y(y)$로 나타낸다. 이게 이렇게 수식으로 보면 어려워보이지만 사실 그렇게 어려운 개념이 아니다. 그러니까 결합확률질량함수에서 X의 주변확률질량함수를 구할 때는 X가 어떤 특정값을 가질 때 Y가 가질 수 있는 모든 값들의 확률들을 모두 더하는 것 뿐이다. 아래 예제를 참고하면 충분히 이해할 수 있을 것이다. 

 

또한 연속확률변수 X, Y의 결합확률질량함수가 주어진 상황에서 X와 Y의 주변확률밀도함수는 각각 다음과 같이 구한다. 

 

 

 

예제: 주변확률질량함수 구하기

확실한 이해를 이해 하나의 예제를 살펴보자. 아래와 같은 이산확률변수 X, Y의 결합확률분포표가 있다고 가정하자. 

 

결합확률분포표

결합확률분포표를 통해서 우리는 이산확률변수 X와 Y가 특정 어떤 값들을 가졌을때의 확률을 알 수 있다. X = 0, Y = 0일 확률 p(0, 0) = 1/6, X = 0, Y = 1일 확률 p(0, 1) = 2/9,... 이런 식으로 말이다. 그러면 X = 0일 때의 확률은 어떻게 구할 수 있을까? 직관적으로 X = 0이면서 Y=0, 1, 2일 때의 확률을 모두 더하면 된다. 이것이 바로 주변확률질량함수를 구하는 방법이다. 위 결합확률분포표에 주변확률들을 추가로 나타내면 다음과 같다. 

 

 

가로로 더하면 Y의 주변확률질량함수를 알게 되고, 세로로 더하면 X의 주변확률질량함수를 알게 된다. 

 

X의 주변확률분포, Y의 주변확률분포를 나타낸 주변확률분포표는 각각 다음과 같다.

 

 

 

<참고자료>

[1] http://m.blog.daum.net/gongdjn/57?tp_nil_a=1, 우헤헤 "결합 확률 분포" 

[2] http://blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220837645914&parentCategoryNo=&categoryNo=38&viewDate=&isShowPopularPosts=true&from=search, 존이 "주변확률분포"