본문 바로가기

Statistical Analysis/R

[R] Spearman correlation coefficient(스피어만 상관 계수), Kendall Tau coefficient(켄달 타우 계수)

둘 다 동일한 목적을 가지고 있기 때문에

스피어만 상관 계수, 켄달 타우 계수는 동시에 같이 해보려 한다.

 

피어슨 상관 계수처럼 두 변수 간 상관 관계를 나타내는 수치지만, 조금 다르다.

피어슨 상관 계수는 변수를 연속형으로 취급하기 때문에 선형 관계를 의미하지만,

얘네들은 변수를 순서형으로 취급하기 때문에 거기서 오는 차이가 조금 있다.

 

우선 가정에서부터 차이가 있다.

1. 두 변수는 적어도 순서형 변수이다.

2. 두 변수는 단조 관계를 가진다.

여기서 말하는 단조 관계라는 것은 산점도를 그렸을 때,

계속 감소하거나 계속 증가하는 형태를 의미한다.

또한, 변수를 순서형으로 취급하기 때문에 이상치에 덜 민감하다.

 

가설은 피어슨 상관 계수와 동일하다.

- 귀무 가설 : 상관 계수는 0이다.

 - 대립 가설 : 상관 계수는 0이 아니다.

 

+ 스피어만과 켄달 타우는 목적이 비슷한데,

소표본이면서 동점이 많을 때는 켄달 타우 계수를 더 선호한다고 한다.


# 데이터 불러오기
sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/13. correlation analysis.csv", header = T)

# 산점도
pairs(sample)

# Spearman
library(psych)
spearman = corr.test(sample,
          use = 'complete',
          method = 'spearman',
          adjust = 'none')
spearman$r
spearman$p

# Kendall tau
kendall = corr.test(sample,
                    use = 'complete',
                    method = 'kendall',
                    adjust = 'none')
kendall$r
kendall$p

https://sw-tatistics.tistory.com/40

 

[R] Pearson correlation coefficient, 피어슨 상관 계수

피어슨 상관 계수는 두 변수의 선형 상관 관계를 계량화한 수치이다. 결과값은 -1~1 사이의 값을 가지고, 1에 가까울수록 양의 상관 관계를 의미하고, -1에 가까울수록 음의 상관 관계를 의미한다.

sw-tatistics.tistory.com

데이터는 이전 포스팅과 동일하게 사용했다.

가정은 위의 글을 참고하고, 결과만 보도록 하자.

 

# Spearman
library(psych)
spearman = corr.test(sample,
          use = 'complete',
          method = 'spearman',
          adjust = 'none')
spearman$r
spearman$p

 

# Kendall tau
kendall = corr.test(sample,
                    use = 'complete',
                    method = 'kendall',
                    adjust = 'none')
kendall$r
kendall$p

 

피어슨 상관 계수와 마찬가지로 모든 변수에서 유의한 상관 관계를 확인할 수 있다.