이산확률변수의 기댓값(평균), 분산, 표준편차

Research/확률, 통계

이산확률변수의 기댓값(평균), 분산, 표준편차

bskyvision.com 2019. 3. 28. 16:38

기댓값(평균)

이산확률변수 X의 기댓값은 다음과 같이 계산한다.

$\large E(X) = m = x_1p_1+x_2p_2+\cdots +x_np_n = \sum_{i=1}^{n}x_ip_i$

여기서 p는 확률질량함수를 의미한다.

기댓값 그리고 괄호 열고 평균이라고 표현했는데, 기댓값과 평균은 같은 것일까? 조금 다른 의미를 갖고 있지만, 사실상 같다고 봐도 무방하다. 평균은 어떤 자료를 대표하는 값 중의 하나로, 단순히 모든 자료값을 더한 것을 자료의 개수로 나눈 값이다[4]. 반면 기댓값은 확률적 사건에 대한 평균값으로 위 공식과 같이 확률변수가 어떤 값을 갖게 될 확률과 그 값을 각각 곱해서 더해준 것이다. 평균을 구함에 있어서 확률이 사용되면 기댓값이라고 보는 것이 좋을 것 같다.

분산과 표준편차

분산은 평균으로부터 어느 정도로 흩어져있는지를 반영한다. 이산확률변수 X의 분산은 다음과 같이 계산한다.

$\large V(X) = \sigma^2 = E((X-m)^2)=\sum_{i=1}^{n}(x_i-m)^2p_i$

분산을 구할 때 편차의 제곱의 평균(기댓값)으로 구하다보니, 실제 데이터와 다른 단위가 되어 버린다. 따라서 분산에 루트를 취함으로 실제 데이터와 같은 단위로 되돌려서 평균으로부터 어느 정도 흩어져 있는지를 판단한다. 그것이 바로 표준편차다.

$\large \sigma(X) = \sqrt{V(X)} = \sigma$

예제: 이산확률변수의 기댓값(평균), 분산, 표준편차 구하기

서로 다른 두 개의 동전을 동시에 던져서 나오는 앞면의 개수를 확률변수 X라고 할 때, X의 평균, 분산, 표준편차를 각각 구하라.

>>

우선, 표본공간 S = {(앞, 앞), (앞, 뒤), (뒤, 앞), (뒤, 뒤)}가 된다. 앞면의 개수가 확률변수 X이기 때문에, P(X=0)=1/4, P(X=1)=2/4, P(X=2)=1/4이 된다. 이를 확률분포표로 나타내면 다음과 같다.

확률분포표

이산확률변수 X의 기댓값은

$\large E(X)=m=(0)(\frac{1}{4})+(1)(\frac{2}{4})+(2)(\frac{1}{4})=1$

이 된다. X의 분산은 X와 X의 기댓값의 편차들의 평균이므로

$\large V(X)=\sigma^2=(0-1)^2\frac{1}{4}+(1-1)^2\frac{2}{4}+(2-1)^2\frac{1}{4}=\frac{1}{2}$

이 된다. 마지막으로 X의 표준편차는 분산에 루트를 취함으로 구하면 된다.

$\large \sigma(X)=\sigma=\sqrt{\frac{1}{2}}$

풀이 끝!

<참고자료>

[1] https://blog.naver.com/mykepzzang/220837877074, 존이, "기댓값"

[2] https://namu.wiki/w/%EA%B8%B0%EB%8C%93%EA%B0%92, 나무위키, "기댓값"

[3] Johnson과 Wichern, "Applied multivariate statistical analysis, 제6판", 피어슨

[4] http://m.blog.daum.net/rhaoslikesan/293?categoryId=33, 산을좋아한라쯔, "평균, 기댓값, 분산, 기대효용"

저작자표시 비영리 (새창열림)