t-test란?
t-test는 두개의 집단이 같은지 다른지 비교하기 위해 사용한다. 여기서의 집단은 샘플(표본)을 뜻한다.
*집단에는 모집단과 샘플(표본)이 있는데, t-test에서 집단은 샘플이다.
그렇다면 어떻게 두개의 집단을 비교할까?
예를 들어 1000명이 있다고 가정한다면, 1000명을 한명한명 비교하다가는 답도 없을 것이다.
따라서, 두 집단의 대표값인 평균값을 사용해서, 평균값이 통계적으로 같은지 다른지를 확인하는 방식으로 두 집단을 비교한다
한 가지 예를 들어, A대학의 남학생들과 B대학의 남학생들의 키가 같은지 다른지 봐보고자 한다.
A대학의 남학생 모두와 B대학의 남학생 모두의 키를 비교할 수 없으니, A대학 남학생의 샘플과 B대학 남학생의 샘플을 뽑아 비교해야한다.
샘플을 뽑아 비교하니 A대학의 남학생들의 평균키는 178.5cm 이고, B대학의 남학생들의 평균키는 179.9cm라 하자.
이 1.4cm 차이를 가지고 A대학 남학생 < B 대학 남학생이라고 말할 수 있을까?
이 질문에 답을 하기 위해서는, 통계적 사고 방식이 필요하다
- 1.4cm의 키차이란 사건이 발생
- 사이 발생할 확률이 5% 미만이라면 우연이 아니고 어떤 이유가 있다고 추정할 수 있기에,
A대학과 B대학의 남학생 평균키 차이인 1.4cm가 우연히 발생했을 확률은 얼마나 될까? 라고 통계적 질문을 해야한다.- 1.4cm가 우연히 발생했다면, 두 남학생 집단의 평균키는 같은 것이고,
- 1.4cm가 우연히 발생하지 않았다면, 즉 어떤 이유가 있다면 두 남학생 집단의 평균키는 다른 것이다.
( =A 대학 남학생 < B 대학 남학생이라고 말할 수 있음)
이렇게 t-test에 대한 결론은 우연히 발생했을 확률을 구함으로써 얻을 수 있다.
+) 내가 써놓고 나중에 내가 볼때 헷갈릴 거 같아서 그림추가함..
그럼 이쯤해서 보는 t-test의 사전적 정의!
집단의 표준편차가 알려지지 않았을 때, 정규분포의 모집단에서 모은 샘플(표본)의 평균값에 대한 가설검정 방법
출처
- Sapientia a Dei