2019-04-30 11:46:54

논문을 읽다보면 심심찮게 t검정이란 놈을 만나게 된다. 처음에는 '이건 뭐지?'하고 당황스러울 수 있다. 나도 그랬다. 하지만 사실 알고 보면 그렇게 무서운 놈은 아니다. 자신이 세운 가설이 변하지 않는 진리에 가까운지, 아니면 진리에서 먼지 확인하는 하나의 검정방법일 뿐이다. 

 

t검정은 모집단의 분산이나 표준편차를 알지 못할 때, 표본으로부터 측정된 분산이나 표준편차를 이용하여 두 모집단의 평균의 차이를 알아보는 검정 방법이다[1]. t검정은 "두 집단간 평균 차이가 없다"는 영가설(null hypothesis)과 "두 집단의 평균에는 차이가 있다"라는 대립가설(alternative hypothesis) 중 하나를 채택하고, 다른 하나는 기각하는 방식으로 이뤄진다[3]. 대립가설이 우리가 세운 가설이다. 따라서 연구자들은 영가설이 기각되고, 대립가설이 채택되는 것을 바라며 t검정을 시행한다.

 

t검정은 크게 3가지로 나눠진다. 독립 표본 t검정, 대응 표본 t검정, 단일 표본 t검정. 간단히 요약하면 다음과 같다.

 

1) 독립 표본 t검정(independent two sample t-test): 서로 다른 두 개의 그룹 간의 평균 비교.

한 건강 관리 컨설턴트가 두 병원의 환자 만족도 등급을 비교하려고 한다. 이 컨설턴트는 각 병원에서 임의로 선정한 환자 20명의 만족도 점수를 수집한다. 컨설턴트는 두 병원의 환자 만족도에 차이가 있는지 확인하기 위해 독립 표본 t검정을 시행한다[6]. 

 

2) 대응 표본 t검정(paired sample t-test): 하나의 집단에 대한 비교.

한 생리학자가 특정 달리기 프로그램이 휴식기 심박수에 영향을 미치는지 확인하려고 한다. 랜덤하게 선택된 20명의 심박수를 측정했다. 그 20명에게 달리기 프로그램에 1년 동안 참여하게 한 후, 1년 후에 다시 심박수를 측정했다. 생리학자는 달리기 프로그램 전 후의 심박수에 차이가 있는지 확인하기 위해 대응 표본 t검정을 시행한다[8].

 

3) 단일 표본 t검정(one sample t-test): 특정 집단의 평균이 어떤 숫자와 같은지 다른지를 비교.

한 경제학자가 올해 한 가정당 월간 에너지 비용이 작년 200달러와 달라졌는지 확인하려고 한다. 경제학자는 25개 가정을 임의로 추출하여 올해 에너지 비용을 기록한다. 경제학자는 월간 에너지 비용이 200달러와 다른지 확인하기 위해 단일 표본 t검정을 시행한다[7]. 

 

오늘은 독립 표본 t검정에 대해서 중점적으로 알아보자. 

 

독립 표본 t검정

우선 두 개의 표본이 독립적이라는 것은 다음과 같은 조건들을 만족한다는 뜻이다.

 

1) 두 개의 표본이 서로 관계없는 모집단에서 추출되었어야 한다.

2) 표본 간에 아무런 관계가 없어야 한다. 

 

독립 표본 t검정은 또한 두 가지로 나눌 수 있다. 

 

1) 스튜던트 t검정(Student's t-test): 두 집단 각각에서 추정된 분산이 동일할 때(equal variance).

2) 웰치 t검정(Welch's t-test): 두 집단 각각에서 추정된 분산이 다를때(unequal variance).

 

두 표본의 분산이 다른 경우가 더 일반적이므로 웰치 t검증이 스튜던트 t검증보다 실제로 더 많이 사용된다. 스튜던트 t검정이든, 웰치 t검정이든 두 집단이 모두 정규 분포를 따른다고 가정하고 진행된다. (참고로 Student는 학생이란 뜻이 아니고, t검정을 처음 개발한 윌리엄 고셋의 필명이다.)

 

1반 남학생 18명의 키가 평균 171.5556cm에 분산이 27.9085이고 2반 남학생 21명의 키가 평균 172.8571cm에 분산이 29.5286라고 하면 2반 남학생들의 키가 1반 남학생들보다 통계적으로 크다고 말할 수 있을까? 

 

이에 대한 답을 하기 위해서는 웰치 t검정을 적용해야 한다. 표본의 크기도 다르고, 분산도 다르기 때문이다. MATLAB의 ttest2함수를 이용해 결과를 확인해보자.

 

MATLAB으로 웰치 t검정 시행하기

먼저 코드를 살펴보자. 

 

벡터 A에는 1반 남학생들의 키가 담겨있고, 벡터 B에는 2반 남학생들의 키가 담겨있다. 그리고 맨 마지막 줄을 보면 ttest2를 이용해서 웰치 t검정을 시행했다. 'Vartype'(분산의 유형)을 'unequal'(다르다)로 설정했기 때문에 웰치 t검정이 되는 것이다. 'Vartype'을 따로 설정하지 않고 디폴트 값으로 놔두면 스튜던트 t검정이 된다. 

 

검정이 5% 유의수준에서 영가설(또는 귀무가설)을 기각한 경우에는 h값으로 1이 나오고, 그렇지 않은 경우에는 h값이 0이 된다. 영가설이 기각되고 대립가설이 채택되어야 두 반 남학생들의 평균 키에 유의미한 차이가 있는 것이다. 대립가설, 즉 차이가 있다는 것이 우리가 주장하고 싶은 것이므로 h가 1이 나와야 연구자 입장에서는 좋은 것이다. 

 

그러면 어떤 결과가 나왔는지 확인해보자. 1반과 2반 남학생들의 평균 키는 정말 통계적으로 유의미한 차이가 있을까? 

 

h = 0, p = 0.4539라는 값이 나왔다. 영가설이 기각되지 않고 채택되었다. 이 말은 두 반 남학생들의 평균 키는 차이가 없다는 것이다.

 

여기서 p는 유의확률로써, 영가설이 맞을 확률을 나타낸다. 유의수준을 5%로 설정했다면, 유의확률이 0.05보다 작아야 영가설이 기각되고 대립가설이 채택된다. p가 0.4539로 0.05보다 크므로 영가설이 기각되지 않은 것이다. 영가설이 맞을 확률이 0.4539가 된다는 뜻이다. 

 

그냥 평균으로만 보면 2반 남학생의 평균 키가 1반 남학생에 비해 1.3cm 정도 크지만 통계적으로는 의미없는 차이임을 웰치 t검정이 보여준 것이다. 

 

-----

 

통계를 본의 아니게 알아야만 하는 모든 분들을 응원합니다. 홧팅! 

 

 

<참고자료>

[1] http://www.incodom.kr/%EC%9D%B4%EB%A1%A0_%EB%B0%8F_T%EA%B2%80%EC%A0%95, 인코덤 "이론 및 T 검정"

[2] http://www.dodomira.com/2016/04/02/r%EC%9D%84-%EC%82%AC%EC%9A%A9%ED%95%9C-t-test/, DODOMIRA "R을 사용한 t-test - 두 그룹 간 평균 차이가 유의미한 지를 비교해보자."

[3] https://terms.naver.com/entry.nhn?docId=4355644&cid=40942&categoryId=31531, 네이버 지식 백과 "t검정"

[4] http://jjy0501.blogspot.com/2017/07/r-t-independent-two-sample-t-test.html, 고든의 블로그 구글 분점 "R의 고전 검사-독립표본 t 검정"

[5] 박규상 지음, "처음쓰는 논문쓰기", 샌들코어

[6] https://support.minitab.com/ko-kr/minitab/18/help-and-how-to/statistics/basic-statistics/how-to/2-sample-t/before-you-start/example/, Minitab 18지원 "2-표본 t검정 예"

[7] https://support.minitab.com/ko-kr/minitab/18/help-and-how-to/statistics/basic-statistics/how-to/1-sample-t/before-you-start/example/, Minitab 18지원 "1-표본 t검정 예"

[8] https://support.minitab.com/ko-kr/minitab/18/help-and-how-to/statistics/basic-statistics/how-to/paired-t/before-you-start/example/, Minitab 18지원 "쌍체 t검정 예"