One Sample t-test, 혹은 일 표본 t 검정은,
한 집단의 평균을 검정하는 통계 분석 방법이다.
분석을 시행하기 위한 가정, 전제로는 정규성 가정이 있다.
여기서 의미하는 정규성 가정은 표본이 정규성을 띄는지를 의미하는데,
이를 위한 통계 검정법도 존재한다.
그런데, 여기서 "중심극한정리"라는 통계학의 주요 이론에 의해,
대표본일 때에는 표본의 평균이 정규분포를 띈다는 것이 증명되어있고,
이 이론에 의해 대표본일 때에는 t test의 가정을 굳이 체크할 필요가 없다.
(자세한 내용은 꽤 길어지니까 생략한다.)
보통 30개 이상을 대표본으로 분류하지만,
이것은 "정의"된 것이 아니며 경험적으로 사용하는 기준에 불과하다.
따라서, 분야에 따라 차이가 있을 수 있다.
본인이 실제로 논문에 사용할 것이라면 반드시 추가적인 확인 절차가 필요하다.
one sample t-test의 가설은 다음과 같이 간단하다.
- 귀무 가설 : 모평균은 M이다.
- 대립 가설 : 모평균은 M이 아니다.
사전에 채택한 통계적 유의 수준보다 p-value가 더 높게 나왔다면,
귀무 가설을 채택하고, 그게 아니라면 대립 가설을 채택한다.
논문 기준으로, 통계적 유의 수준은 주로 5%(= 0.05)로 둔다.
# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/01.one_sample_t_test.csv", header = T)
# 정규성 검정(shapiro-wilk test)
shapiro.test(sample$height)
# t-test
mu0 = 150
t.test(sample$height, mu = mu0)
간단한 예제 코드를 만들어 보았다.
파일은 아래 파일을 사용하였으니, 비교를 원한다면 사용해보시길 바란다.
코드 하나씩 결과를 살펴보자.
# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/01.one_sample_t_test.csv", header = T)
sample이라는 이름에 해당 csv파일 데이터를 로드한다.
header는 첫 번째 행을 변수명으로 쓸 것인지 결정하는 옵션이다.
여기서는 T를 썼으니, 첫 행을 변수명으로 사용한다는 뜻.
변수 1개, 관측치 20개인 데이터가 생성되었다.
그리고 이를 이용해서 t-test를 실시할 예정.
# 정규성 검정(shapiro-wilk test)
shapiro.test(sample$height)
t-test의 가정이 충족되는지 확인하기 위해 shapiro-wilk test를 실시하였다.
shapiro-wilk test은,
귀무 가설이 정규성을 만족하는 것이고, 대립 가설이 만족하지 않는 것이다.
따라서, p-value가 0.4397이므로 귀무 가설을 채택하고 정규성을 만족하는 것으로 본다.
이것으로 t-test를 사용하기 위한 통계적 근거가 마련된 것으로 보면 된다.
# t-test
mu0 = 150
t.test(sample$height, mu = mu0)
가설 설정과 검정 단계라고 보면 된다.
나는 키가 150인지 아닌지를 검정하고 싶다.
따라서, mu0에 150이라는 값을 저장해놓고, t.test 함수 문법에 따라 값을 넣어주었다.
(mu0에 값을 저장하지 않고, 바로 150을 써도 상관 없다.)
통계적 유의 수준은 0.05로 두었다.
보통 단측 검정은 잘 하지 않는다..
따라서, 양측 검정의 결과만 보겠다.
"t-test를 이론적으로 이해하고 싶다!"
하는게 아니라면 그냥 p-value만 보도록 하자.
p-value는 얼핏봐도 0.05보다 작은 값이다.
따라서, 귀무 가설을 기각하고 대립 가설을 채택한다.
그렇다면, 표본을 통해 해당 집단의 키의 평균은 150이 아니라고 주장할 근거를 얻은 것이다.
더 나아가자면, 키의 평균이 156.1165이므로 키의 평균이 150보다 클 것이라는 이야기도 할 수 있겠다.
'Statistical Analysis > R' 카테고리의 다른 글
[R] Wilcoxon signed rank test, 윌콕슨 부호 순위 검정 (0) | 2022.06.21 |
---|---|
[R] Paired Sample t-test, 대응 표본 t 검정 (0) | 2022.06.19 |
[R] Independent Sample t-test, 독립 표본 t 검정 (0) | 2022.06.19 |
R studio for Windows 설치 (0) | 2022.04.25 |
R-4.2.0 for Windows 설치 (0) | 2022.04.25 |