이산확률변수의 기댓값(평균), 분산, 표준편차

기댓값(평균)

이산확률변수 X의 기댓값은 다음과 같이 계산한다. 

 

 

여기서 p는 확률질량함수를 의미한다. 

 

기댓값 그리고 괄호 열고 평균이라고 표현했는데, 기댓값과 평균은 같은 것일까? 조금 다른 의미를 갖고 있지만, 사실상 같다고 봐도 무방하다. 평균은 어떤 자료를 대표하는 값 중의 하나로, 단순히 모든 자료값을 더한 것을 자료의 개수로 나눈 값이다[4]. 반면 기댓값은 확률적 사건에 대한 평균값으로 위 공식과 같이 확률변수가 어떤 값을 갖게 될 확률과 그 값을 각각 곱해서 더해준 것이다. 평균을 구함에 있어서 확률이 사용되면 기댓값이라고 보는 것이 좋을 것 같다.

 

분산과 표준편차

분산은 평균으로부터 어느 정도로 흩어져있는지를 반영한다. 이산확률변수 X의 분산은 다음과 같이 계산한다.  

 

 

분산을 구할 때 편차의 제곱의 평균(기댓값)으로 구하다보니, 실제 데이터와 다른 단위가 되어 버린다. 따라서 분산에 루트를 취함으로 실제 데이터와 같은 단위로 되돌려서 평균으로부터 어느 정도 흩어져 있는지를 판단한다. 그것이 바로 표준편차다.  

 

 

예제: 이산확률변수의 기댓값(평균), 분산, 표준편차 구하기

서로 다른 두 개의 동전을 동시에 던져서 나오는 앞면의 개수를 확률변수 X라고 할 때, X의 평균, 분산, 표준편차를 각각 구하라. 

 

>> 

 

우선, 표본공간 S = {(앞, 앞), (앞, 뒤), (뒤, 앞), (뒤, 뒤)}가 된다. 앞면의 개수가 확률변수 X이기 때문에, P(X=0)=1/4, P(X=1)=2/4, P(X=2)=1/4이 된다. 이를 확률분포표로 나타내면 다음과 같다. 

 

확률분포표

이산확률변수 X의 기댓값은 

 

 

이 된다. X의 분산은 X와 X의 기댓값의 편차들의 평균이므로 

 

 

이 된다. 마지막으로 X의 표준편차는 분산에 루트를 취함으로 구하면 된다. 

 

 

풀이 끝! 

 

 

<참고자료>

[1] https://blog.naver.com/mykepzzang/220837877074, 존이, "기댓값"

[2] https://namu.wiki/w/%EA%B8%B0%EB%8C%93%EA%B0%92, 나무위키, "기댓값"

[3] Johnson과 Wichern, "Applied multivariate statistical analysis, 제6판", 피어슨

[4] http://m.blog.daum.net/rhaoslikesan/293?categoryId=33, 산을좋아한라쯔, "평균, 기댓값, 분산, 기대효용"

댓글()