본문 바로가기

Statistical Analysis/R

[R] Welch's t-test, Welch's T 검정

Welch's T검정은

독립 표본 T검정에서 등분산성 가정이 만족되지 못 할 때 사용한다.

 

가정은 독립 표본 T검정에서 등분산성 가정만 제외하면 된다.

1. 정규성 : 각 집단의 표본은 정규성을 만족해야 한다.

2. 독립성 : 두 집단은 서로 독립적이어야 한다.

만약, 등분산성 가정까지 추가된다면, 독립 표본 T검정과 동일하다.

 

가설은 독립 표본 T검정과 동일하다.

- 귀무 가설 : 두 집단의 평균은 동일하다.

- 대립 가설 : 두 집단의 평균은 동일하지 않다.


# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/02. Independent sample t-test.csv", header = T)

# 정규성 검정(shapiro-wilks test)
shapiro.test(sample[sample$group == "A", "height"])
shapiro.test(sample[sample$group == "B", "height"])

# Welch's t-test
t.test(data = sample,
       height ~ group,
       var.equal = FALSE)
t.test(sample[sample$group == "A", "height"],
       sample[sample$group == "B", "height"],
       var.equal = FALSE)

https://sw-tatistics.tistory.com/27

 

[R] Independent Sample t-test, 독립 표본 t 검정

Independent Sample t-test, 독립표본 t 검정은 두 집단의 평균을 비교하는 통계 분석법이다. 분석의 가정으로는 3가지가 있다. 1. 정규성 가정 : 각 집단의 표본은 정규성을 가진다. 2. 등분산성 가정 : 두

sw-tatistics.tistory.com

독립 표본 T검정과 동일한 데이터로 해보자.

다만, 이 데이터에서는 등분산성이 만족한다.

여기서는 등분산성 가정이 만족되지 않는다고 생각하고 하자.

T검정 코드를 제외하면 모두 동일하기 때문에 마지막 코드만 살펴보자.

 

# Welch's t-test
t.test(data = sample,
       height ~ group,
       var.equal = FALSE)
t.test(sample[sample$group == "A", "height"],
       sample[sample$group == "B", "height"],
       var.equal = FALSE)

첫 번째 코드와 두 번째 코드는 동일하게 작동한다.

코드의 입력값을 보면 아주 직관적이라는 것을 확인할 수 있는데,

var.equal = FALSE

즉, 양쪽 분산이 같지 않다는 의미다.

결과 문구도 Welch Two Sample t-test로 바뀌어 나온다.

 

해석은 비슷한 방법으로 하면 된다.

p-value가 매우 낮기 때문에 귀무 가설을 기각하고,

두 집단의 평균은 다르다는 대립 가설을 채택한다.