본문 바로가기

Statistical Analysis/R

(22)
[R] Cronbach's Alpha, 크론바흐 알파 크론바흐 알파 계수는 주로 설문조사 항목에 대한 신뢰도를 확인하기 위해 사용한다. 설문조사를 하는 곳이라면 흔히 사용되고 있을 것이기 때문에 상황에 대한 언급은 따로 하지 않겠다. 사실 본인도 기존 연구를 참고하여 사용하였을 뿐이었는데, 이번 기회에 이론적인 부분을 좀 더 살펴보았다. 특별한 확인 없이 사용했던 것치고는 나름대로 가정이 있었다. 1. 각 항목은 동일한 주제(목적)을 측정한다. 2. 각 항목의 중요도는 모두 동일하다. 가정이 하나 더 있는 것 같긴한데, 신경 안 써도 될 것 같다. 일반적인 경우, 결과값은 0~1 사이의 값을 가지게 되고, 1에 가까울수록 신뢰도가 높은 것으로 해석한다. 가끔 음수가 나오는 경우가 있는데 실수를 한 게 없는지, 데이터에 오류가 없는지를 확인해봐야 한다. 어떻..
[R] Welch's ANOVA Welch's ANOVA는 ANOVA의 가정 중에서 등분산성 가정이 만족되지 못 할 때 사용하는 검정법이다. 가정은 등분산성 가정만 제외하면 ANOVA와 같다. 1. 정규성 : 각 집단의 표본은 정규성을 만족해야 한다. 2. 독립성 : 각 집단의 표본은 서로 독립적이어야 한다. 여기에 등분산성 가정까지 만족한다면, ANOVA를 쓰면 된다. 가설은 ANOVA와 동일하다. - 귀무 가설 : 모든 집단의 평균은 동일하다. - 대립 가설 : 모든 집단의 평균이 동일한 것은 아니다. # 데이터 불러오기 sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/07. ANOVA.csv", header = T) table(sample$group) boxplot(da..
[R] Welch's t-test, Welch's T 검정 Welch's T검정은 독립 표본 T검정에서 등분산성 가정이 만족되지 못 할 때 사용한다. 가정은 독립 표본 T검정에서 등분산성 가정만 제외하면 된다. 1. 정규성 : 각 집단의 표본은 정규성을 만족해야 한다. 2. 독립성 : 두 집단은 서로 독립적이어야 한다. 만약, 등분산성 가정까지 추가된다면, 독립 표본 T검정과 동일하다. 가설은 독립 표본 T검정과 동일하다. - 귀무 가설 : 두 집단의 평균은 동일하다. - 대립 가설 : 두 집단의 평균은 동일하지 않다. # 데이터 불러오기 sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/02. Independent sample t-test.csv", header = T) # 정규성 검정(shapiro-..
[R] Kruskal Wallis test, 크루스칼 왈리스 검정 크루스칼 왈리스 검정은 ANOVA의 가정 중에서 정규성 가정이 만족되지 않을 때 사용하는 비모수 검정이다. 비모수 검정답게 가정은 훨씬 간단하다. 1. 표본은 독립적이어야 한다. 2. 측정값은 최소 순서형 변수여야 한다. 가설에서도 약간의 변화가 있다. 평균을 비교하는 ANOVA와 달리 중앙값을 비교하게 된다. - 귀무 가설 : 모든 그룹의 중앙값은 같다. - 대립 가설 : 모든 그룹의 중앙값이 같은 것은 아니다. # 데이터 불러오기 sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/07. ANOVA.csv", header = T) table(sample$group) boxplot(data = sample, time ~ group) # Krusk..
[R] Analysis of Variance(ANOVA), 분산 분석 분산 분석, ANOVA.. 내 경험 상, 논문에서 아주 흔하게 볼 수 있는 검정법이다. 뭐든 이론을 파면 복잡하지만, ANOVA는 친숙한 이미지에 비해 상당히 난해한 이론을 가진 듯.. 하지만, 포스팅의 목적이 "사용"에 초점이 맞춰져있기 때문에 이론은 가볍게 패스하도록 하자. 이름은 '분산' 분석이지만, 실제론 평균을 비교하는 검정법이다. 평균 검정이라고하면 독립 표본 T검정도 평균을 비교하는 검정법이었다. 2개의 차이는 무엇일까? 독립 표본 T검정은 집단이 2개일 때 사용하는 분석이고, ANOVA는 3개 이상일 때 사용한다. "ANOVA는 집단이 2개일때 쓰면 안되나?" 하는 궁금증은 접어두도록 하자. 필자도 예전에 이런 궁금증으로 고민을 하다가 2개일 때는 T검정이 조금 더 유리하다는 결론을 냈었다..
[R] Wilcoxon rank sum test, 윌콕슨 순위합 검정 윌콕슨 순위합 검정은 독립 표본 T 검정에 대응되는 비모수 검정법이다. 이전 포스팅에서 윌콕슨 부호 순위 검정이 일표본 T검정에 대응된다고 했었다. 이번 포스팅도 같은 맥락이다. 독립표본 T검정에서 정규성 가정이 충족되지 못 할 때 사용한다. 하나 언급하자면, 맨 휘트니 U 검정이라는 것도 찾아볼 수 있는데, 결과는 완전히 동일하다. 과정에서 조금의 차이는 있을지 몰라도, 결과는 완전히 동일하니 헷갈리지 말자. 가정은 비모수 검정답게 간단한 편이다. 1. 두 그룹은 서로 독립적이어야 한다. 2. 측정값은 최소 순서형 변수여야 한다. 순서형 변수가 헷갈린다면, 대소 비교가 가능한지 여부로 생각하자. 어쨌든 해당 검정법의 가정 조건은 간단하다. 가설도 약간의 변화가 있다. 독립 표본 T검정이 평균 비교라면,..
[R] Wilcoxon signed rank test, 윌콕슨 부호 순위 검정 윌곡슨 부호 순위 검정은 일표본/대응표본 T검정에 대응되는 비모수 검정법이다. 비모수 검정법에 대해 간단하게 언급해보자면.. 앞서 정리한 T검정 내용 중에 "가정"이라는 것이 있었다. 말 그대로 검정법을 수행하기 위한 전제 정도로 생각하면 되는데, 이 가정이 성립하지 않는다면?? 예컨데, 정규성 가정이 성립되지 않는 경우가 있겠다. 이처럼 가정을 충족할 때, 시행하는 검정법을 모수 검정법이라고 보면 되고, 가정이 충족되지 않을 때, 사용하는 것이 비모수 검정법이라고 보면 된다. 일반적으로는 모수 검정법의 검정력이 더 뛰어나다. 그렇기 때문에 가능하면 모수 검정법을 시행하는 것이 유리하다고 볼 수 있다. 다시 돌아와서, "일표본/대응표본 T검정에서 정규성 가정이 만족되지 않을 때" 윌콕슨 부호 순위 검정을..
[R] Paired Sample t-test, 대응 표본 t 검정 Paired Sample t-test, 대응 표본 T 검정은 동일한 대상에게서 얻은 "값 차이"의 평균을 비교하는 검정법이다. 쉽게 생각하면 전/후 비교라고 보면 된다. 다이어트 프로그램 전/후 몸무게 비교 같은.. 미리 이야기하자면, 대응표본 T검정과 일 표본 T검정과 동일하다고 보면된다. 비교할 값의 차이를 일표본 T검정한다고 생각하면 좋다. 그렇기 때문에 분석의 가정도 정규성 가정만 존재한다. 약간의 차이가 있다면, 비교할 값의 차이가 정규성을 가진다는 것이다. 가설도 거의 비슷하다. - 귀무 가설 : 비교할 값의 차이의 평균은 0이다. - 대립 가설 : 비교할 값의 차이의 평균은 0이 아니다. 대입하듯이 문장을 만들고보니 조금 어색한데, 쉽게 생각하면 값의 차이가 없다/있다 정도로 보아도 될듯하다..
[R] Independent Sample t-test, 독립 표본 t 검정 Independent Sample t-test, 독립표본 t 검정은 두 집단의 평균을 비교하는 통계 분석법이다. 분석의 가정으로는 3가지가 있다. 1. 정규성 가정 : 각 집단의 표본은 정규성을 가진다. 2. 등분산성 가정 : 두 집단의 분산은 동일하다. 3. 독립성 가정 : 두 집단은 서로 독립적이다. Independent Sample t-test 의 가설은 다음과 같다. - 귀무 가설 : 두 모집단의 평균은 같다. - 대립 가설 :두 모집단의 평균은 같지 않다. library(lawstat) # 데이터 불러오기 sample = read.csv("F:/Sw-tastics/Statistics Analysis/example/02. Independent sample t-test.csv", header = T..
[R] One Sample t-test, 일 표본 t 검정 One Sample t-test, 혹은 일 표본 t 검정은, 한 집단의 평균을 검정하는 통계 분석 방법이다. 분석을 시행하기 위한 가정, 전제로는 정규성 가정이 있다. 여기서 의미하는 정규성 가정은 표본이 정규성을 띄는지를 의미하는데, 이를 위한 통계 검정법도 존재한다. 그런데, 여기서 "중심극한정리"라는 통계학의 주요 이론에 의해, 대표본일 때에는 표본의 평균이 정규분포를 띈다는 것이 증명되어있고, 이 이론에 의해 대표본일 때에는 t test의 가정을 굳이 체크할 필요가 없다. (자세한 내용은 꽤 길어지니까 생략한다.) 보통 30개 이상을 대표본으로 분류하지만, 이것은 "정의"된 것이 아니며 경험적으로 사용하는 기준에 불과하다. 따라서, 분야에 따라 차이가 있을 수 있다. 본인이 실제로 논문에 사용할 ..