모평균, 모분산과 표본평균, 표본분산 그리고 표본평균의 평균, 표본평균의 분산
어떤 모집단에서 조사하고자 하는 특성을 나타내는 확률변수 X라고 할 때, X의 평균, 분산, 표준편차를 모평균, 모분산, 모표준편차라고 부르고 각각 다음과 같은 기호로 나타낸다.
모평균은 라고 표기하기도 한다. (개인적으로 대학과정 이상에서는 m보다는 가 좀 더 일반적인 것 같다.)
모집단에서 임의추출한 크기가 n인 표본을 이라 할 때, 이들의 평균, 분산, 표준편차를 표본평균, 표본분산, 표본표준편차라 부르고 기호로는 다음과 같이 나타낸다.
예를 들어, 1, 3, 5의 숫자가 각각 적혀 있는 3개의 공이 한 주머니에 들어 있다고 가정해보자. 이 주머니에서 1개의 공을 임의추출할 때, 공에 적힌 숫자를 이산확률변수 X라고 하자. 1번 공, 3번 공, 5번 공이 뽑힐 확률은 모두 동일하게 1/3이다. 따라서 X의 확률분포는 다음과 같을 것이다.
확률변수 X의 평균과 분산을 구해보자.
이것은 모집단에서 구한 것들이기에 모평균과 모분산이다.
이제 모집단에서 임의추출로 2개의 표본을 추출해보자(표본의 크기 n = 2). 뽑힌 표본을 각각 이라고 하자. 이 가질 수 있는 값은 1, 3, 5 중 하나 일 것이고, 도 마찬가지다. 따라서 총 9가지 경우가 가능하다. 추출된 표본에 따른 표본평균들은 다음과 같이 표로 나타낼 수 있다.
여기서 중요한 것은 표본평균 이 추출된 표본에 따라 그 값이 변하는 확률변수라는 사실이다. 표본평균의 평균, 표본평균의 분산은 간단하다. 이 표본평균들(1, 2, 3, 2, 3, 4, 3, 4, 5)의 평균과 분산을 구하면 되기 때문이다. 따라서 표본평균의 평균은
이 되고, 표본평균의 분산은
이 된다. 여기서 알 수 있는 것은 표본평균의 평균은 모평균과 동일하고, 표본평균의 분산은 모분산을 표본의 크기로 나눈 것과 같다는 것이다.
<참고자료>
[1] https://math7.tistory.com/14?category=471451, 나부랭이의 수학블로그 "분산과 표준편차와 평균의 관계는?"
[2] https://www.youtube.com/watch?v=Lt0xWiiWtrQ&t=623s, 수악중독 "모평균&모분산, 표본평균&표본분산, 표본평균의 평균&표본평균의 분산"
[3] 이홍섭, "개념원리 확률과 통계"