본문 바로가기

Statistical Analysis/R

[R] Independent Sample t-test, 독립 표본 t 검정

Independent Sample t-test, 독립표본 t 검정은

두 집단의 평균을 비교하는 통계 분석법이다.

 

분석의 가정으로는 3가지가 있다.

1. 정규성 가정 : 각 집단의 표본은 정규성을 가진다.

2. 등분산성 가정 : 두 집단의 분산은 동일하다.

3. 독립성 가정 : 두 집단은 서로 독립적이다.

 

Independent Sample t-test 의 가설은 다음과 같다.

- 귀무 가설 : 두 모집단의 평균은 같다.

- 대립 가설 :두 모집단의 평균은 같지 않다.


library(lawstat)

# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/02. Independent sample t-test.csv", header = T)

# 정규성 검정(shapiro-wilks test)
shapiro.test(sample[sample$group == "A", "height"])
shapiro.test(sample[sample$group == "B", "height"])

# 등분산성 검정
levene.test(sample$height, sample$group, location = 'mean')

# t-test
t.test(data = sample,
       height ~ group,
       var.equal = TRUE)
t.test(sample[sample$group == "A", "height"],
       sample[sample$group == "B", "height"],
       var.equal = TRUE)

 

위는 A, B 그룹의 평균을 비교하는 간단한 예제이다.

데이터는 아래 파일을 사용하였다.

02. Independent sample t-test.csv
0.00MB

 

 

코드의 결과를 하나씩 살펴보자.

library(lawstat)

# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/02. Independent sample t-test.csv", header = T)

"lawstat"이라는 라이브러리를 불러왔고,

데이터를 로드했다.

데이터는 2개의 변수와 40개의 관측치로 이루어져있다.

2개의 변수는 그룹과 값이다.

 

# 정규성 검정(shapiro-wilks test)
shapiro.test(sample[sample$group == "A", "height"])
shapiro.test(sample[sample$group == "B", "height"])

정규성 가정을 확인하였다.

두 그룹 모두 정규성을 만족한다.

 

# 등분산성 검정
levene.test(sample$height, sample$group, location = 'mean')

등분산성 가정을 확인하였다.

등분산성 검정도 정규성 검정처럼 p-value가 작을수록 분산이 다름을 의미한다.

 

# t-test
t.test(data = sample,
       height ~ group,
       var.equal = TRUE)
t.test(sample[sample$group == "A", "height"],
       sample[sample$group == "B", "height"],
       var.equal = TRUE)

그 다음은 t-test이다.

두 가지 코드가 있는데, 둘 다 작동한다.

편한대로 쓰도록 하자.

 

p-value가 0.05보다 작으므로 귀무가설을 기각하고,

두 집단 A, B의 평균은 서로 다르다고 할 수 있다.


독립성 가정을 확인하는 작업을 하지 않았는데,

독립성 가정이라는 것 자체가 꽤나 모호한 개념이다.

"두 집단은 서로 독립적이다."

 

여기서는 표본 수집 과정에서 독립성을 만족할 수 있다고 가정하고 진행하기로 하자.