결합확률질량함수와 결합확률밀도함수

확률질량함수는 이산확률변수와 관련된 것이고, 확률밀도함수는 연속확률변수와 관련된 것이라고 이전 포스팅에서 다뤘었다. https://bskyvision.com/387

 

결합확률질량함수(joint probability mass function)는 역시 이산확률변수와 관련된 것이고, 결합확률밀도함수(joint probability density function)는 역시 연속확률변수와 관련된 것이다. 결합이라는 단어가 새롭게 추가된 이유는 이산확률변수 두 개(또는 연속확률변수 두 개)가 서로 결합되어 있기 때문이다. 

 

결합확률질량함수

두 이산확률변수 X, Y가 각각 을 취할 수 있을 때 X가 의 값을 갖고, Y가 의 값을 가질 확률은 다음과 같이 나타낼 수 있다.

 

 

여기서 을 이산확률변수 X, Y의 결합확률질량함수(또는 결합확률분포)라고 한다. 확률변수 X가 어떤 특정한 값을 가지고, 확률변수 Y가 어떤 특정한 값을 가질 때의 확률을 나타내는 함수다. 

 

예를 들어, 3개의 빨간 공, 2개의 노란 공, 4개의 초록 공이 들어있는 주머니에서 임의로 2개의 공을 꺼낼 때 뽑은 빨간 공의 개수를 확률변수 X라 하고, 뽑은 노란 공의 개수를 확률변수 Y라고 설정해보자. 확률변수 X가 취할 수 있는 값은 0, 1, 2가 되고, 마찬가지로 확률변수 Y가 취할 수 있는 값도 0, 1, 2가 된다. 단 두 변수의 값의 합이 2를 초과할 수는 없다. 2개의 공을 꺼내기 때문이다. 따라서 가능한 순서쌍은 (0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (2, 0) 이렇게 6개가 있다. 각각에 대한 확률을 구해보자.

 

1) 빨간 공 0개, 노란 공 0개, (초록 공 2개)를 뽑는 경우의 확률: 

 

 

2) 빨간 공 0개, 노란 공 1개, (초록 공 1개)를 뽑는 경우의 확률: 

 

 

3) 빨간 공 0개, 노란 공 2개, (초록 공 0개)를 뽑는 경우의 확률:

 

 

4) 빨간 공 1개, 노란 공 0개, (초록 공 1개)를 뽑는 경우의 확률:

 

 

5) 빨간 공 1개, 노란 공 1개, (초록 공 0개)를 뽑는 경우의 확률:

 

 

6) 빨간 공 2개, 노란 공 0개, (초록 공 0개)를 뽑는 경우의 확률:

 

 

이 확률들을 아래와 같이 결합확률분포표에 담으면 좀 더 보기 좋다. 

 

결합확률분포표

 

모든 확률을 더하면 당연히 1이다. 

 

 

 

결합확률밀도함수

두 개의 연속확률변수 X와 Y가 존재할 때, X가 a이상 b이하이면서 Y가 c이상 d이하일 확률은 다음과 같이 나타낸다.

 

 

여기서 f(x, y)를 연속확률변수 X, Y의 결합확률밀도함수라고 부른다. 

 

임의로 선택한 30세 성인의 키를 연속확률변수 X라고 하면 키가 170-175cm일 확률은 다음과 같이 구할 수 있다. 

 

 

여기서 f(x)는 연속확률변수 X의 확률밀도함수이다. 그러나 30세 성인의 키가 170cm이상 175cm이하이면서 동시에 몸무게가 80kg 이상 85kg이하일 확률은 결합확률밀도함수를 사용해야한다. 임의 선택된 30세 성인의 몸무게를 연속확률변수 Y로 나타내겠다. 

 

 

키와 몸무게는 완전히 독립적이라고 볼 수 없기 때문이다. 두 확률변수가 ;만약에 서로 통계적으로 독립이라면 아래와 같이 단순히 두 확률을 곱하는 것으로 확률을 구할 수 있다. 

 

 

 

<참고자료>

[1] http://blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220836609004&parentCategoryNo=&categoryNo=38&viewDate=&isShowPopularPosts=true&from=search, 존이 "이산확률변수의 결합확률분포"

[2] http://blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220836634095&parentCategoryNo=&categoryNo=38&viewDate=&isShowPopularPosts=true&from=search, 존이 "연속확률변수의 결합확률분포"

[3] http://m.blog.daum.net/gongdjn/57?tp_nil_a=1, 우헤헤 "결합확률분포"

댓글()