어떤 모집단에서 조사하고자 하는 특성을 나타내는 확률변수 X라고 할 때, X의 평균, 분산, 표준편차를 모평균, 모분산, 모표준편차라고 부르고 각각 다음과 같은 기호로 나타낸다.
모평균은 라고 표기하기도 한다. (개인적으로 대학과정 이상에서는 m보다는 가 좀 더 일반적인 것 같다.)
모집단에서 임의추출한 크기가 n인 표본을 이라 할 때, 이들의 평균, 분산, 표준편차를 표본평균, 표본분산, 표본표준편차라 부르고 기호로는 다음과 같이 나타낸다.
예를 들어, 1, 3, 5의 숫자가 각각 적혀 있는 3개의 공이 한 주머니에 들어 있다고 가정해보자. 이 주머니에서 1개의 공을 임의추출할 때, 공에 적힌 숫자를 이산확률변수 X라고 하자. 1번 공, 3번 공, 5번 공이 뽑힐 확률은 모두 동일하게 1/3이다. 따라서 X의 확률분포는 다음과 같을 것이다.
확률변수 X의 평균과 분산을 구해보자.
이것은 모집단에서 구한 것들이기에 모평균과 모분산이다.
이제 모집단에서 임의추출로 2개의 표본을 추출해보자(표본의 크기 n = 2). 뽑힌 표본을 각각 이라고 하자. 이 가질 수 있는 값은 1, 3, 5 중 하나 일 것이고, 도 마찬가지다. 따라서 총 9가지 경우가 가능하다. 추출된 표본에 따른 표본평균들은 다음과 같이 표로 나타낼 수 있다.
여기서 중요한 것은 표본평균 이 추출된 표본에 따라 그 값이 변하는 확률변수라는 사실이다. 표본평균의 평균, 표본평균의 분산은 간단하다. 이 표본평균들(1, 2, 3, 2, 3, 4, 3, 4, 5)의 평균과 분산을 구하면 되기 때문이다. 따라서 표본평균의 평균은
이 되고, 표본평균의 분산은
이 된다. 여기서 알 수 있는 것은 표본평균의 평균은 모평균과 동일하고, 표본평균의 분산은 모분산을 표본의 크기로 나눈 것과 같다는 것이다.
<참고자료>
[1] https://math7.tistory.com/14?category=471451, 나부랭이의 수학블로그 "분산과 표준편차와 평균의 관계는?"
[2] https://www.youtube.com/watch?v=Lt0xWiiWtrQ&t=623s, 수악중독 "모평균&모분산, 표본평균&표본분산, 표본평균의 평균&표본평균의 분산"
[3] 이홍섭, "개념원리 확률과 통계"
'Research > 확률, 통계' 카테고리의 다른 글
독립 표본 t검정은 무엇인가? (MATLAB 코드 포함) (0) | 2019.04.30 |
---|---|
다변량 정규분포의 확률밀도함수 (MATLAB 소스코드 포함) (2) | 2019.04.02 |
이산확률변수들의 공분산과 상관계수 구하기 (0) | 2019.04.02 |
모집단과 표본집단의 평균벡터, 공분산행렬, 상관행렬 (2) | 2019.04.01 |
주변확률질량함수와 주변확률밀도함수 (0) | 2019.03.29 |
결합확률질량함수와 결합확률밀도함수 (5) | 2019.03.29 |
이산확률변수의 기댓값(평균), 분산, 표준편차 (2) | 2019.03.28 |
확률질량함수와 확률밀도함수 (왜 질량과 밀도??) (4) | 2019.03.28 |